课程价格 :
¥599.00
剩余名额
0
-
学习时长
11周/建议每周8个小时
-
答疑服务
专属微信答疑群/讲师直接参与
-
作业批改
每章节设计作业/及时批改评优
- 第1章: 概述
- 第1节: 强化学习概述
- 1:【教材】强化学习参考教材.rar
- 2-1:【课件】强化学习概述.pdf
- 2-2:【视频】强化学习概述
- 2-3:【作业】Homework I.rar
- 2-4:【参考答案】Homework I参考答案.rar
- 第2章: 马尔可夫决策过程
- 3-1:【参考文献】Existence of Optimal Policies.pdf
- 3-2:【课件】马尔可夫决策过程
- 3-3:【视频】马尔可夫决策过程(上)
- 3-4:【视频】马尔可夫决策过程(下)
- 3-5:【资料】作业及代码.rar
- 第3章: 动态规划
- 4-1:【视频】动态规划
- 4-2:【课件】动态规划
- 4-3:【作业及代码】动态规划.rar
- 第4章: 无模型方法一:蒙特卡洛
- 5-1:【视频】无模型方法一:蒙特卡洛
- 5-2:【课件】无模型方法一:蒙特卡洛
- 5-3:【资料】无模型方法一:蒙特卡洛
- 5-4:【作业】无模型方法一:蒙特卡洛
- 5-5:【作业答案&代码】hw4.rar
- 第5章: 无模型方法二:时间差分
- 6-1:【视频】无模型方法二:时间差分
- 6-2:【课件】无模型方法二:时间差分
- 6-3:【作业】无模型方法二:时间差分
- 7:【作业答案&代码】hw5.rar
- 第6章: 无模型方法三:多步自举
- 8-1:【视频】无模型方法三:多步自举
- 8-2:【课件】无模型方法三:多步自举
- 8-3:【作业&资料】无模型方法三:多步自举
- 第7章: 函数近似与深度网络
- 9-1:【视频】函数近似与深度网络
- 9-2:【课件】函数近似与深度网络
- 9-3:【作业】函数近似与深度网络
- 第8章: 策略梯度算法
- 10-1:【视频】策略梯度算法
- 10-2:【课件】策略梯度算法
- 10-3:【作业】策略梯度算法
- 第9章: 深度强化学习
- 11-1:【课件】深度强化学习
- 11-2:【视频】深度强化学习(1)
- 11-3:【视频】深度强化学习(2)
- 11-4:【作业】深度强化学习
- 第10章: 基于模型的强化学习
- 12-1:【课件】基于模型的强化学习
- 12-2:【视频】基于模型的强化学习
- 12-3:【作业】基于模型的强化学习
- 第11章: 前景与大作业
- 13-1:【课件】前景与大作业
- 13-2:【视频】前景与大作业
- 13-3:【作业】前景与大作业
- 第12章: 作业参考答案
- 14:学员成绩及优秀学员评选结果
- 15:Homework I参考答案.rar
- 16:Homework II参考答案.rar
- 17:Homework III参考答案.rar
- 18:Homework IV参考答案.rar
- 19:Homework V参考答案.rar
- 20:Homework VI参考答案.rar
- 21:Homework VII 参考答案.rar
- 22:Homework VIII 参考答案.rar
- 23:Homework IX 参考答案.rar