首页
拜师
课程
定制计划
博客资源站
手机app
首页
拜师
课程
定制计划
博客资源站
手机app
登录
注册
登录
注册
深度强化学习DRL
第11任务: 9. Multi-Step+TD+Target+(TD+Learning+3_3).mp4
查看课程
任务列表
第1任务: 上阶段考核通过卡点
第2任务: 1. (1)深度强化学习基础:基本概念.mp4
第3任务: 2. (2)深度强化学习基础:价值学习.mp4
第4任务: 3. (3)深度强化学习基础:策略学习.mp4
第5任务: 4. (4)深度强化学习基础:Actor-Critic.mp4
第6任务: 5. (5)深度强化学习基础:AlphaGo.mp4
第7任务: 每日作业
第8任务: 6. (6)数学基础:蒙特卡洛+Monte+Carlo.mp4
第9任务: 7. Sarsa算法_(TD_Learning_1_3).mp4
第10任务: 8. Q-Learning算法+(TD+Learning+2_3).mp4
第11任务: 9. Multi-Step+TD+Target+(TD+Learning+3_3).mp4
第12任务: 10. 经验回放+Experience+Replay+(价值学习高级技巧+1_3).mp4
第13任务: 11. 高估问题、Target+Network、Double+DQN+(价值学习高级技巧+2_3).mp4
第14任务: 12. Dueling+Network+(价值学习高级技巧+3_3).mp4
第15任务: 14. 多智能体强化学习(2_2):三种架构++Multi-Agent+Reinforcement+Learning.mp4
第16任务: 13. 多智能体强化学习(1_2):基本概念++Multi-Agent+Reinforcement+Learning.mp4
第17任务: 每日作业
第18任务: 15. 策略梯度中的Baseline+(1_4).mp4
第19任务: 16. REINFORCE+with+Baseline+(策略梯度中的Baseline+2_4).mp4
第20任务: 21. 随机策略做连续控制+(连续控制+3_3).mp4
第21任务: 18. REINFORCE与A2C的异同+(策略梯度中的Baseline+4_4).mp4
第22任务: 19. 离散控制与连续控制+(连续控制+1_3).mp4
第23任务: 20. 确定策略梯度+Deterministic+Policy+Gradient,+DPG+(连续控制+2_3).mp4
第24任务: 17. A2C+方法+(策略梯度中的Baseline+3_4).mp4
第25任务: 每日作业