摘要: 在强化学习(十一) Prioritized Replay DQN中,我们讨论了对DQN的经验回放池按权重采样来优化DQN算法的方法,本文讨论另一种优化方法,Dueling DQN。本章内容主要参考了ICML 2016的deep RL tutorial和Dueling DQN的论文<Dueling N 阅读全文
posted @ 2018-11-08 14:04 刘建平Pinard 阅读(57052) 评论(74) 推荐(5) 编辑