Python 中的高级强化学习：从 DQN 到 SAC ( Advanced Reinforcement Learning in Python: from DQN to SAC )

教程演示🔗

课程描述

这是 Udemy 上最完整的高级强化学习课程。在其中，您将学习使用 PyTorch 和 PyTorch 闪电在 Python 中实现一些最强大的深度强化学习算法。您将从头开始实施自适应算法，根据经验解决控制任务。您将学习将这些技术与神经网络和深度学习方法相结合，以创建能够解决决策任务的自适应人工智能代理。
本课程将向您介绍强化学习技术的最新水平。它还将为您准备本系列的后续课程，我们将在这些课程中探索在其他类型的任务中表现出色的其他高级方法。该课程侧重于培养实践技能。因此，在学习了每一类方法中最重要的概念之后，我们将从头开始在 jupyter notebooks 中实现它们的一个或多个算法。
调平模块：

复习：马尔可夫决策过程 (MDP)。
复习：Q 学习。
复习：神经网络简介。
复习：深度 Q 学习。
复习：策略梯度方法

高级强化学习：

PyTorch 闪电。
使用 Optuna 进行超参数调整。
连续动作空间的深度 Q 学习（归一化优势函数 – NAF）。
深度确定性策略梯度 (DDPG)。
双延迟 DDPG (TD3)。
软演员评论家 (SAC)。
事后经验重播 (HER)。

你会学到什么

掌握一些最先进的强化学习算法。
了解如何创建可以在复杂环境中行动以实现其目标的 AI。
使用 Python 最流行的语言从头开始创建高级强化学习代理
工具（PyTorch Lightning、OpenAI gym、Brax、Optuna）
了解如何执行超参数调整（为我们的 AI 学习选择最佳实验条件）
从根本上了解每个算法的学习过程。
调试和扩展所提供的算法。
从研究论文中理解和实施新算法。

本课程适合谁

想要在机器学习领域找到一份工作的开发人员。
寻求扩展知识广度的数据科学家/分析师和 ML 从业者。
机器人专业的学生和研究人员。
工科学生和研究人员。

Python 高级强化学习规范：从 DQN 到 SAC

发行商：Udemy
教师：逃逸速度实验室
英语语言
级别：所有级别
课程数量：112
时长：8小时5分钟

Python高级强化学习内容：从DQN到SAC 2022-12

要求

熟悉 Python 编程
完成我们的课程“从初学者到精通强化学习”或熟悉
强化学习的基础知识（或观看本课程中包含的水平部分）。
了解基本统计数据（均值、方差、正态分布）

图片

声明：本站所有文章，如无特殊说明或标注，均为本站发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

Python 中的高级强化学习：从 DQN 到 SAC ( Advanced Reinforcement Learning in Python: from DQN to SAC )

教程演示🔗