强化学习理论与实践 - 深蓝学院 - 专注人工智能与机器人的学习平台

学习时长

11周/建议每周8个小时
答疑服务

专属微信答疑群/讲师直接参与
作业批改

每章节设计作业/及时批改评优

课程价格：￥599.00

已报满

支持花呗分期

已报满

第1章: 概述
第1节: 强化学习概述
1：【教材】强化学习参考教材.rar 敬请期待
2-1：【课件】强化学习概述.pdf 敬请期待
2-2：【视频】强化学习概述敬请期待
2-3：【作业】Homework I.rar 敬请期待
2-4：【参考答案】Homework I参考答案.rar 敬请期待

第2章: 马尔可夫决策过程
3-1：【参考文献】Existence of Optimal Policies.pdf 敬请期待
3-2：【课件】马尔可夫决策过程敬请期待
3-3：【视频】马尔可夫决策过程（上）敬请期待
3-4：【视频】马尔可夫决策过程（下）敬请期待
3-5：【资料】作业及代码.rar 敬请期待

第3章: 动态规划
4-1：【视频】动态规划敬请期待
4-2：【课件】动态规划敬请期待
4-3：【作业及代码】动态规划.rar 敬请期待

第4章: 无模型方法一：蒙特卡洛
5-1：【视频】无模型方法一：蒙特卡洛敬请期待
5-2：【课件】无模型方法一：蒙特卡洛敬请期待
5-3：【资料】无模型方法一：蒙特卡洛敬请期待
5-4：【作业】无模型方法一：蒙特卡洛敬请期待
5-5：【作业答案&代码】hw4.rar 敬请期待

第5章: 无模型方法二：时间差分
6-1：【视频】无模型方法二：时间差分敬请期待
6-2：【课件】无模型方法二：时间差分敬请期待
6-3：【作业】无模型方法二：时间差分敬请期待
7：【作业答案&代码】hw5.rar 敬请期待

第6章: 无模型方法三：多步自举
8-1：【视频】无模型方法三：多步自举敬请期待
8-2：【课件】无模型方法三：多步自举敬请期待
8-3：【作业&资料】无模型方法三：多步自举敬请期待

第7章: 函数近似与深度网络
9-1：【视频】函数近似与深度网络敬请期待
9-2：【课件】函数近似与深度网络敬请期待
9-3：【作业】函数近似与深度网络敬请期待

第8章: 策略梯度算法
10-1：【视频】策略梯度算法敬请期待
10-2：【课件】策略梯度算法敬请期待
10-3：【作业】策略梯度算法敬请期待

第9章: 深度强化学习
11-1：【课件】深度强化学习敬请期待
11-2：【视频】深度强化学习（1）敬请期待
11-3：【视频】深度强化学习（2）敬请期待
11-4：【作业】深度强化学习敬请期待

第10章: 基于模型的强化学习
12-1：【课件】基于模型的强化学习敬请期待
12-2：【视频】基于模型的强化学习敬请期待
12-3：【作业】基于模型的强化学习敬请期待

第11章: 前景与大作业
13-1：【课件】前景与大作业敬请期待
13-2：【视频】前景与大作业敬请期待
13-3：【作业】前景与大作业敬请期待

第12章: 作业参考答案
14：学员成绩及优秀学员评选结果敬请期待
15：Homework I参考答案.rar 敬请期待
16：Homework II参考答案.rar 敬请期待
17：Homework III参考答案.rar 敬请期待
18：Homework IV参考答案.rar 敬请期待
19：Homework V参考答案.rar 敬请期待
20：Homework VI参考答案.rar 敬请期待
21：Homework VII 参考答案.rar 敬请期待
22：Homework VIII 参考答案.rar 敬请期待
23：Homework IX 参考答案.rar 敬请期待

+ 86

中国 +86
美国 +1
日本 +81
中国香港 +852
中国澳门 +853
中国台湾 +886
马来西亚 +60
澳大利亚 +61
加拿大 +1
英国 +44
新加坡 +65
德国 +49
俄罗斯 +7
埃及 +20
南非 +27
希腊 +30
荷兰 +31
比利时 +32
法国 +33
西班牙 +34
匈牙利 +36
意大利 +39
罗马尼亚 +40
瑞士 +41
奥地利 +43
丹麦 +45
瑞典 +46
挪威 +47
波兰 +48
秘鲁 +51
墨西哥 +52
古巴 +53
阿根廷 +54
巴西 +55
智利 +56
哥伦比亚 +57
委内瑞拉 +58
印度尼西亚 +62
菲律宾 +63
新西兰 +64
泰国 +66
哈萨克斯坦 +7
韩国 +82
越南 +84
土耳其 +90
印度 +91
巴基斯坦 +92
阿富汗 +93
斯里兰卡 +94
缅甸 +95
伊朗 +98
摩洛哥 +212
阿尔及利亚 +213
突尼斯 +216
利比亚 +218
冈比亚 +220
塞内加尔 +221
马里 +223
几内亚 +224
科特迪瓦 +225
布基纳法索 +226
尼日尔 +227
多哥 +228
贝宁 +229
毛里求斯 +230
利比里亚 +231
塞拉利昂 +232
加纳 +233
尼日利亚 +234
乍得 +235
中非共和国 +236
喀麦隆 +237
圣多美和普林西比 +239
加蓬 +241
刚果民主共和国 +243
安哥拉 +244
阿森松岛 +247
塞舌尔 +248
苏丹 +249
埃塞俄比亚 +251
索马里 +252
吉布提 +253
肯尼亚 +254
坦桑尼亚 +255
乌干达 +256
布隆迪 +257
莫桑比克 +258
赞比亚 +260
马达加斯加 +261
津巴布韦 +263
纳米比亚 +264
马拉维 +265
莱索托 +266
博茨瓦纳 +267
斯威士兰 +268
直布罗陀 +350
葡萄牙 +351
卢森堡 +352
爱尔兰 +353
冰岛 +354
阿尔巴尼亚 +355
马耳他 +356
塞浦路斯 +357
芬兰 +358
保加利亚 +359
立陶宛 +370
拉脱维亚 +371
爱沙尼亚 +372
摩尔多瓦 +373
亚美尼亚 +374
白俄罗斯 +375
安道尔共和国 +376
摩纳哥 +377
圣马力诺 +378
乌克兰 +380
斯洛文尼亚 +386
捷克 +420
斯洛伐克 +421
列支敦士登 +423
伯利兹 +501
瓜地马拉 +502
萨尔瓦多 +503
洪都拉斯 +504
尼加拉瓜 +505
哥斯达黎加 +506
巴拿马 +507
海地 +509
玻利维亚 +591
圭亚那 +592
厄瓜多尔 +593
法属圭亚那 +594
巴拉圭 +595
马提尼克 +596
苏里南 +597
乌拉圭 +598
文莱 +673
巴布亚新几内亚 +675
汤加 +676
所罗门群岛 +677
斐济 +679
库克群岛 +682
法属波利尼西亚 +689
柬埔寨 +855
老挝 +856
孟加拉国 +880
马尔代夫 +960
黎巴嫩 +961
约旦 +962
叙利亚 +963
伊拉克 +964
科威特 +965
沙特阿拉伯 +966
也门 +967
阿曼 +968
阿拉伯联合酋长国 +971
以色列 +972
巴林 +973
卡塔尔 +974
蒙古 +976
尼泊尔 +977
塔吉克斯坦 +992
土库曼斯坦 +993
阿塞拜疆 +994
格鲁吉亚 +995
吉尔吉斯斯坦 +996
乌兹别克斯坦 +998
巴哈马 +1242
巴巴多斯 +1246
安圭拉岛 +1264
安提瓜和巴布达 +1268
开曼群岛 +1345
百慕大群岛 +1441
格林纳达 +1473
蒙特塞拉特岛 +1664
关岛 +1671
毛里塔尼亚 +222
圣露西亚 +1758
波多黎各 +1787
多明尼加共和国 +1809
特立尼达和多巴哥 +1868
牙买加 +1876
塞尔维亚共和国 +381

获取验证码

账号密码登录

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

服务协议反馈建议联系邮箱：hezuo@shenlanxueyuan.com

友情链接：

在线咨询

常见问题

证书查询

返回顶部

学习时长

答疑服务

作业批改

相关推荐