教程演示🔗

课程描述

这是 Udemy 上最完整的高级强化学习课程。在其中,您将学习使用 PyTorch 和 PyTorch 闪电在 Python 中实现一些最强大的深度强化学习算法。您将从头开始实施自适应算法,根据经验解决控制任务。您将学习将这些技术与神经网络和深度学习方法相结合,以创建能够解决决策任务的自适应人工智能代理。
本课程将向您介绍强化学习技术的最新水平。它还将为您准备本系列的后续课程,我们将在这些课程中探索在其他类型的任务中表现出色的其他高级方法。该课程侧重于培养实践技能。因此,在学习了每一类方法中最重要的概念之后,我们将从头开始在 jupyter notebooks 中实现它们的一个或多个算法。
调平模块:

  • 复习:马尔可夫决策过程 (MDP)。
  • 复习:Q 学习。
  • 复习:神经网络简介。
  • 复习:深度 Q 学习。
  • 复习:策略梯度方法

高级强化学习:

  • PyTorch 闪电。
  • 使用 Optuna 进行超参数调整。
  • 连续动作空间的深度 Q 学习(归一化优势函数 – NAF)。
  • 深度确定性策略梯度 (DDPG)。
  • 双延迟 DDPG (TD3)。
  • 软演员评论家 (SAC)。
  • 事后经验重播 (HER)。

你会学到什么

  • 掌握一些最先进的强化学习算法。
  • 了解如何创建可以在复杂环境中行动以实现其目标的 AI。
  • 使用 Python 最流行的语言从头开始创建高级强化学习代理
  • 工具(PyTorch Lightning、OpenAI gym、Brax、Optuna)
  • 了解如何执行超参数调整(为我们的 AI 学习选择最佳实验条件)
  • 从根本上了解每个算法的学习过程。
  • 调试和扩展所提供的算法。
  • 从研究论文中理解和实施新算法。

本课程适合谁

  • 想要在机器学习领域找到一份工作的开发人员。
  • 寻求扩展知识广度的数据科学家/分析师和 ML 从业者。
  • 机器人专业的学生和研究人员。
  • 工科学生和研究人员。

Python 高级强化学习规范:从 DQN 到 SAC

  • 发行商:Udemy
  • 教师:逃逸速度实验室
  • 英语语言
  • 级别:所有级别
  • 课程数量:112
  • 时长:8小时5分钟

Python高级强化学习内容:从DQN到SAC 2022-12

要求

  • 熟悉 Python 编程
  • 完成我们的课程“从初学者到精通强化学习”或熟悉
  • 强化学习的基础知识(或观看本课程中包含的水平部分)。
  • 了解基本统计数据(均值、方差、正态分布)

图片

发表回复

后才能评论

尊敬的用户,您好!由于部分培训机构和留学生的举报,近期导致网站大量链接暂时失效。对此给您带来的不便,我们深表歉意。任何链接失效的资源,欢迎您添加侧边栏二维码随时反馈,我们将在48小时内为您提供新的网盘链接。如果您对此不便感到不满,您也可在48小时内申请无理由退款。感谢您的理解与支持!

Windows播放器推荐:Potplayer Potplayer 是免费的 Windows 播放器,支持双字幕和自动翻译功能。以下是操作指南: 挂载字幕 加载中文字幕:右击选择 字幕 -> 字幕设置,取消“只匹配文件名字幕”选项。可调整字幕颜色、位置和大小。 双字幕设置:右击 字幕 -> 选择字幕 -> 次字幕输出,设置主字幕和次字幕。 自动翻译 若可访问 Google 翻译服务,选择 字幕 -> 实时字幕翻译,勾选 总是使用 和 Google Translate,即可实时翻译英文字幕。 Potplayer 让观看更智能,学习体验升级。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可联络站长解决。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源