首页
拜师
课程
定制计划
博客资源站
手机app
首页
拜师
课程
定制计划
博客资源站
手机app
登录
注册
登录
注册
深度强化学习(DRL)
第23任务: 019 - 随机策略做连续控制 (连续控制 3_3).mp4
查看课程
任务列表
第1任务: 上阶段考核通过卡点
第2任务: 文档资料下载
第3任务: 001 - 深度强化学习(1_5):基本概念 Deep Reinforcement Learning (1_5).mp4
第4任务: 002 - 深度强化学习(2_5):价值学习 Value-Based Reinforcement Learning.mp4
第5任务: 003 - 深度强化学习(3_5):策略学习 Policy-Based Reinforcement Learning.mp4
第6任务: 004 - 深度强化学习(4_5):Actor-Critic Methods.mp4
第7任务: 005 - 深度强化学习(5_5):AlphaGo.mp4
第8任务: 每日作业
第9任务: 006 - 蒙特卡洛 Monte Carlo.mp4
第10任务: 007 - Sarsa算法 (TD Learning 1_3).mp4
第11任务: 008 - Q-Learning算法 (TD Learning 2_3).mp4
第12任务: 009 - Multi-Step TD Target (TD Learning 3_3).mp4
第13任务: 010 - 经验回放 Experience Replay (价值学习高级技巧 1_3).mp4
第14任务: 011 - 高估问题、Target Network、Double DQN (价值学习高级技巧 2_3).mp4
第15任务: 012 - Dueling Network (价值学习高级技巧 3_3).mp4
第16任务: 013 - 策略梯度中的Baseline (1_4).mp4
第17任务: 014 - REINFORCE with Baseline (策略梯度中的Baseline 2_4).mp4
第18任务: 每日作业
第19任务: 015 - A2C 方法 (策略梯度中的Baseline 3_4).mp4
第20任务: 016 - REINFORCE与A2C的异同 (策略梯度中的Baseline 4_4).mp4
第21任务: 017 - 离散控制与连续控制 (连续控制 1_3).mp4
第22任务: 018 - 确定策略梯度 Deterministic Policy Gradient, DPG (连续控制 2_3).mp4
第23任务: 019 - 随机策略做连续控制 (连续控制 3_3).mp4
第24任务: 020 - 多智能体强化学习(2_2):三种架构 Multi-Agent Reinforcement Learning.mp4
第25任务: 021 - 多智能体强化学习(1_2):基本概念 Multi-Agent Reinforcement Learning.mp4
第26任务: 每日作业