Deep RL Bootcamp Lecture 4B Policy Gradients Revisited

 https://drive.google.com/file/d/0BxXI_RttTZAhTUpqUFdEZ3BXNFE/view

 

 

 

game of Pong is a MDP.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

终于一睹AK真容了,很有想法,很幽默

 http://karpathy.github.io/

 

 

posted @ 2018-05-01 12:52  ecoflex  阅读(174)  评论(0编辑  收藏  举报