深度学习课程笔记(十三)深度强化学习 --- 策略梯度方法(Policy Gradient Methods)

深度学习课程笔记(十三)深度强化学习 --- 策略梯度方法(Policy Gradient Methods)

2018-07-17 16:50:12 

 

Reference: https://www.youtube.com/watch?v=z95ZYgPgXOY&t=512s  

 

 

 

 

posted @ 2018-07-17 16:53  AHU-WangXiao  阅读(594)  评论(0编辑  收藏  举报