首页
拜师
课程
定制计划
博客资源站
手机app
首页
拜师
课程
定制计划
博客资源站
手机app
登录
注册
登录
注册
首页
前沿技术
人工智能
深度学习/Tensorflow
深度强化学习DRL
0
人加入学习
(0人评价)
深度强化学习DRL
价格
免费
教学计划
自由式学习
解锁式学习
学习有效期
长期有效
已收藏
收藏
分享
扫一扫
扫二维码继续学习 二维码时效为半小时
分享
已收藏
收藏
抱歉,该课程为限制课程,请联系客服
目录
笔记
(0)
评价
(0)
介绍
全部
解锁式学习
自由式学习
8. Q-Learning算法+(TD+Learning+2_3).mp4
全部任务
1. (1)深度强化学习基础:基...
2. (2)深度强化学习基础:价...
3. (3)深度强化学习基础:策...
4. (4)深度强化学习基础:A...
5. (5)深度强化学习基础:A...
每日作业
6. (6)数学基础:蒙特卡洛+...
7. Sarsa算法_(TD_L...
8. Q-Learning算法+...
9. Multi-Step+TD...
10. 经验回放+Experie...
11. 高估问题、Target+...
12. Dueling+Netw...
14. 多智能体强化学习(2_2...
13. 多智能体强化学习(1_2...
每日作业
15. 策略梯度中的Baseli...
16. REINFORCE+wi...
21. 随机策略做连续控制+(连...
18. REINFORCE与A2...
19. 离散控制与连续控制+(连...
20. 确定策略梯度+Deter...
17. A2C+方法+(策略梯度...
1. (1)深度强化学习基础:基...
2. (2)深度强化学习基础:价...
3. (3)深度强化学习基础:策...
4. (4)深度强化学习基础:A...
5. (5)深度强化学习基础:A...
每日作业
6. (6)数学基础:蒙特卡洛+...
7. Sarsa算法_(TD_L...
8. Q-Learning算法+...
9. Multi-Step+TD...
10. 经验回放+Experie...
11. 高估问题、Target+...
12. Dueling+Netw...
14. 多智能体强化学习(2_2...
13. 多智能体强化学习(1_2...
每日作业
15. 策略梯度中的Baseli...
16. REINFORCE+wi...
21. 随机策略做连续控制+(连...
18. REINFORCE与A2...
19. 离散控制与连续控制+(连...
20. 确定策略梯度+Deter...
17. A2C+方法+(策略梯度...
上阶段考核通过卡点
每日作业
上阶段考核通过卡点
每日作业
排序:
最新笔记
最新笔记
点赞最多
暂无笔记
授课教师
森陌夏栀
高级算法工程师
teacher01
老师
teacher02
teacher03
课程特色
考试(4)
视频(21)
学员动态
还没有动态