深度强化学习(DRL) - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训| - Powered By EduSoho

0人加入学习

(0人评价)

深度强化学习(DRL)

价格免费

教学计划

学习有效期长期有效

扫一扫扫二维码继续学习二维码时效为半小时
分享
已收藏
收藏

抱歉，该课程为限制课程，请联系客服

课程介绍

目录

[{"itemType":"chapter","number":"1","published_number":0,"title":"\u7b2c1\u5929\u7684\u5b66\u4e60\u5185\u5bb9\u300c\u5efa\u8bae\u6309\u8ba1\u5212\u5b8c\u6210\u6bcf\u5929\u4efb\u52a1\u300d\u4ee5\u4fdd\u8bc1\u6700\u7ec8\u76ee\u6807\u6309\u8ba1\u5212\u8fbe\u6210\uff01\uff01\uff01","result":"","resultStatus":"","lock":"","status":"published","taskId":"2743072","isOptional":"0","type":"chapter","isTaskFree":"","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"","activityEndTime":"","fileStorage":"","isTaskTryLookable":"","isSingleTaskLesson":false},{"itemType":"task","number":"1","published_number":"1","title":"\u4e0a\u9636\u6bb5\u8003\u6838\u901a\u8fc7\u5361\u70b9","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155103","isOptional":"0","type":"testpaper","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"2","published_number":"2","title":"\u6587\u6863\u8d44\u6599\u4e0b\u8f7d","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155104","isOptional":"0","type":"text","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"3","published_number":"3","title":"001 - \u6df1\u5ea6\u5f3a\u5316\u5b66\u4e60(1_5)\uff1a\u57fa\u672c\u6982\u5ff5 Deep Reinforcement Learning (1_5).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155105","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"40:00","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"4","published_number":"4","title":"002 - \u6df1\u5ea6\u5f3a\u5316\u5b66\u4e60(2_5)\uff1a\u4ef7\u503c\u5b66\u4e60 Value-Based Reinforcement Learning.mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155106","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"28:11","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"5","published_number":"5","title":"003 - \u6df1\u5ea6\u5f3a\u5316\u5b66\u4e60(3_5)\uff1a\u7b56\u7565\u5b66\u4e60 Policy-Based Reinforcement Learning.mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155107","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"22:52","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"6","published_number":"6","title":"004 - \u6df1\u5ea6\u5f3a\u5316\u5b66\u4e60(4_5)\uff1aActor-Critic Methods.mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155108","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"23:40","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"7","published_number":"7","title":"005 - \u6df1\u5ea6\u5f3a\u5316\u5b66\u4e60(5_5)\uff1aAlphaGo.mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155109","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"53:42","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"8","published_number":"8","title":"\u6bcf\u65e5\u4f5c\u4e1a","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155110","isOptional":"0","type":"testpaper","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"chapter","number":"2","published_number":0,"title":"\u7b2c2\u5929\u7684\u5b66\u4e60\u5185\u5bb9\u300c\u5efa\u8bae\u6309\u8ba1\u5212\u5b8c\u6210\u6bcf\u5929\u4efb\u52a1\u300d\u4ee5\u4fdd\u8bc1\u6700\u7ec8\u76ee\u6807\u6309\u8ba1\u5212\u8fbe\u6210\uff01\uff01\uff01","result":"","resultStatus":"","lock":"","status":"published","taskId":"2743091","isOptional":"0","type":"chapter","isTaskFree":"","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"","activityEndTime":"","fileStorage":"","isTaskTryLookable":"","isSingleTaskLesson":false},{"itemType":"task","number":"9","published_number":"9","title":"006 - \u8499\u7279\u5361\u6d1b Monte Carlo.mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155111","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"25:23","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"10","published_number":"10","title":"007 - Sarsa\u7b97\u6cd5 (TD Learning 1_3).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155112","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"10:55","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"11","published_number":"11","title":"008 - Q-Learning\u7b97\u6cd5 (TD Learning 2_3).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155113","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"08:32","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"12","published_number":"12","title":"009 - Multi-Step TD Target (TD Learning 3_3).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155114","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"06:35","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"13","published_number":"13","title":"010 - \u7ecf\u9a8c\u56de\u653e Experience Replay (\u4ef7\u503c\u5b66\u4e60\u9ad8\u7ea7\u6280\u5de7 1_3).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155115","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"14:18","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"14","published_number":"14","title":"011 - \u9ad8\u4f30\u95ee\u9898\u3001Target Network\u3001Double DQN (\u4ef7\u503c\u5b66\u4e60\u9ad8\u7ea7\u6280\u5de7 2_3).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155116","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"19:42","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"15","published_number":"15","title":"012 - Dueling Network (\u4ef7\u503c\u5b66\u4e60\u9ad8\u7ea7\u6280\u5de7 3_3).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155117","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"15:10","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"16","published_number":"16","title":"013 - \u7b56\u7565\u68af\u5ea6\u4e2d\u7684Baseline (1_4).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155118","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"09:47","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"17","published_number":"17","title":"014 - REINFORCE with Baseline (\u7b56\u7565\u68af\u5ea6\u4e2d\u7684Baseline 2_4).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155119","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"11:25","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"18","published_number":"18","title":"\u6bcf\u65e5\u4f5c\u4e1a","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155120","isOptional":"0","type":"testpaper","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"chapter","number":"3","published_number":0,"title":"\u7b2c3\u5929\u7684\u5b66\u4e60\u5185\u5bb9\u300c\u5efa\u8bae\u6309\u8ba1\u5212\u5b8c\u6210\u6bcf\u5929\u4efb\u52a1\u300d\u4ee5\u4fdd\u8bc1\u6700\u7ec8\u76ee\u6807\u6309\u8ba1\u5212\u8fbe\u6210\uff01\uff01\uff01","result":"","resultStatus":"","lock":"","status":"published","taskId":"2743080","isOptional":"0","type":"chapter","isTaskFree":"","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"","activityEndTime":"","fileStorage":"","isTaskTryLookable":"","isSingleTaskLesson":false},{"itemType":"task","number":"19","published_number":"19","title":"015 - A2C \u65b9\u6cd5 (\u7b56\u7565\u68af\u5ea6\u4e2d\u7684Baseline 3_4).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155121","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"18:45","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"20","published_number":"20","title":"016 - REINFORCE\u4e0eA2C\u7684\u5f02\u540c (\u7b56\u7565\u68af\u5ea6\u4e2d\u7684Baseline 4_4).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155122","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"07:43","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"21","published_number":"21","title":"017 - \u79bb\u6563\u63a7\u5236\u4e0e\u8fde\u7eed\u63a7\u5236 (\u8fde\u7eed\u63a7\u5236 1_3).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155123","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"04:21","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"22","published_number":"22","title":"018 - \u786e\u5b9a\u7b56\u7565\u68af\u5ea6 Deterministic Policy Gradient, DPG (\u8fde\u7eed\u63a7\u5236 2_3).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155124","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"15:49","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"23","published_number":"23","title":"019 - \u968f\u673a\u7b56\u7565\u505a\u8fde\u7eed\u63a7\u5236 (\u8fde\u7eed\u63a7\u5236 3_3).mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155125","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"20:32","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"24","published_number":"24","title":"020 - \u591a\u667a\u80fd\u4f53\u5f3a\u5316\u5b66\u4e60(2_2)\uff1a\u4e09\u79cd\u67b6\u6784 Multi-Agent Reinforcement Learning.mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155126","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"18:36","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"25","published_number":"25","title":"021 - \u591a\u667a\u80fd\u4f53\u5f3a\u5316\u5b66\u4e60(1_2)\uff1a\u57fa\u672c\u6982\u5ff5 Multi-Agent Reinforcement Learning.mp4","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155127","isOptional":"0","type":"video","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"18:36","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true},{"itemType":"task","number":"26","published_number":"26","title":"\u6bcf\u65e5\u4f5c\u4e1a","result":"","resultStatus":"","lock":false,"status":"published","taskId":"2155128","isOptional":"0","type":"testpaper","isTaskFree":"0","watchLimitRemaining":false,"replayStatus":"","activityStartTimeStr":"","activityStartTime":"","activityLength":"","activityEndTime":"","fileStorage":"","isTaskTryLookable":0,"isSingleTaskLesson":true}]

查看全部

授课教师

森陌夏栀

高级算法工程师

teacher03

teacher02

teacher01

老师

课程特色

考试(4)

图文(1)

视频(21)

学员动态

还没有动态