首页
拜师
课程
定制计划
博客资源站
手机app
首页
拜师
课程
定制计划
博客资源站
手机app
登录
注册
登录
注册
首页
前沿技术
人工智能
深度学习/Tensorflow
深度强化学习(DRL)
0
人加入学习
(0人评价)
深度强化学习(DRL)
价格
免费
教学计划
自由式学习
解锁式学习
学习有效期
长期有效
已收藏
收藏
分享
扫一扫
扫二维码继续学习 二维码时效为半小时
分享
已收藏
收藏
抱歉,该课程为限制课程,请联系客服
目录
笔记
(0)
评价
(0)
介绍
全部
解锁式学习
自由式学习
014 - REINFORCE with Baseline (策略梯度中的Baseline 2_4).mp4
全部任务
001 - 深度强化学习(1_5...
002 - 深度强化学习(2_5...
003 - 深度强化学习(3_5...
004 - 深度强化学习(4_5...
005 - 深度强化学习(5_5...
每日作业
006 - 蒙特卡洛 Monte...
007 - Sarsa算法 (T...
008 - Q-Learning...
009 - Multi-Step...
010 - 经验回放 Exper...
011 - 高估问题、Targe...
012 - Dueling Ne...
013 - 策略梯度中的Base...
014 - REINFORCE ...
每日作业
015 - A2C 方法 (策略...
016 - REINFORCE与...
017 - 离散控制与连续控制 ...
018 - 确定策略梯度 Det...
019 - 随机策略做连续控制 ...
020 - 多智能体强化学习(2...
021 - 多智能体强化学习(1...
上阶段考核通过卡点
文档资料下载
每日作业
上阶段考核通过卡点
文档资料下载
001 - 深度强化学习(1_5...
002 - 深度强化学习(2_5...
003 - 深度强化学习(3_5...
004 - 深度强化学习(4_5...
005 - 深度强化学习(5_5...
每日作业
006 - 蒙特卡洛 Monte...
007 - Sarsa算法 (T...
008 - Q-Learning...
009 - Multi-Step...
010 - 经验回放 Exper...
011 - 高估问题、Targe...
012 - Dueling Ne...
013 - 策略梯度中的Base...
014 - REINFORCE ...
每日作业
015 - A2C 方法 (策略...
016 - REINFORCE与...
017 - 离散控制与连续控制 ...
018 - 确定策略梯度 Det...
019 - 随机策略做连续控制 ...
020 - 多智能体强化学习(2...
021 - 多智能体强化学习(1...
每日作业
排序:
最新笔记
最新笔记
点赞最多
暂无笔记
授课教师
森陌夏栀
高级算法工程师
teacher03
teacher02
teacher01
老师
课程特色
考试(4)
图文(1)
视频(21)
学员动态
还没有动态