摘要: Asynchronous Methods for Deep Reinforcement Learning ICML 2016 深度强化学习最近被人发现貌似不太稳定,有人提出很多改善的方法,这些方法有很多共同的 idea:一个 online 的 agent 碰到的观察到的数据序列是非静态的,然后就是, 阅读全文
posted @ 2016-07-18 15:43 AHU-WangXiao 阅读(7401) 评论(0) 推荐(0) 编辑