首页
拜师
课程
定制计划
博客资源站
手机app
首页
拜师
课程
定制计划
博客资源站
手机app
登录
注册
登录
注册
首页
前沿技术
人工智能
深度学习/Tensorflow
深度强化学习(DRL)
0
人加入学习
(0人评价)
深度强化学习(DRL)
价格
免费
教学计划
自由式学习
解锁式学习
学习有效期
长期有效
已收藏
收藏
分享
扫一扫
扫二维码继续学习 二维码时效为半小时
分享
已收藏
收藏
抱歉,该课程为限制课程,请联系客服
目录
笔记
(0)
评价
(0)
介绍
全部
解锁式学习
自由式学习
全部任务
全部任务
001 - 深度强化学习(1_5...
002 - 深度强化学习(2_5...
003 - 深度强化学习(3_5...
004 - 深度强化学习(4_5...
005 - 深度强化学习(5_5...
每日作业
006 - 蒙特卡洛 Monte...
007 - Sarsa算法 (T...
008 - Q-Learning...
009 - Multi-Step...
010 - 经验回放 Exper...
011 - 高估问题、Targe...
012 - Dueling Ne...
013 - 策略梯度中的Base...
014 - REINFORCE ...
每日作业
015 - A2C 方法 (策略...
016 - REINFORCE与...
017 - 离散控制与连续控制 ...
018 - 确定策略梯度 Det...
019 - 随机策略做连续控制 ...
020 - 多智能体强化学习(2...
021 - 多智能体强化学习(1...
上阶段考核通过卡点
文档资料下载
每日作业
上阶段考核通过卡点
文档资料下载
001 - 深度强化学习(1_5...
002 - 深度强化学习(2_5...
003 - 深度强化学习(3_5...
004 - 深度强化学习(4_5...
005 - 深度强化学习(5_5...
每日作业
006 - 蒙特卡洛 Monte...
007 - Sarsa算法 (T...
008 - Q-Learning...
009 - Multi-Step...
010 - 经验回放 Exper...
011 - 高估问题、Targe...
012 - Dueling Ne...
013 - 策略梯度中的Base...
014 - REINFORCE ...
每日作业
015 - A2C 方法 (策略...
016 - REINFORCE与...
017 - 离散控制与连续控制 ...
018 - 确定策略梯度 Det...
019 - 随机策略做连续控制 ...
020 - 多智能体强化学习(2...
021 - 多智能体强化学习(1...
每日作业
排序:
最新笔记
最新笔记
点赞最多
暂无笔记
授课教师
森陌夏栀
高级算法工程师
teacher03
teacher02
teacher01
老师
课程特色
考试(4)
图文(1)
视频(21)
学员动态
还没有动态