摘要: 在强化学习(八)价值函数的近似表示与Deep Q-Learning中,我们讲到了Deep Q-Learning(NIPS 2013)的算法和代码,在这个算法基础上,有很多Deep Q-Learning(以下简称DQN)的改进版,今天我们来讨论DQN的第一个改进版Nature DQN(NIPS 201 阅读全文
posted @ 2018-10-08 20:40 刘建平Pinard 阅读(67870) 评论(84) 推荐(11) 编辑