2019年1月23日

6. Double DQN、Prioritized DQN、Dueling DQN

摘要: 本篇介绍三种DQN的变体,分别是从参数更新部分改进的Double DQN,从经验回放部分改进的Prioritized DQN,从神经网络结构部分改进的Dueling DQN。 Double DQN 上一篇提到的DQN是基于Q-learning,更新也是基于贪婪算法,$Q \leftarrow Q + 阅读全文

posted @ 2019-01-23 20:41 yijun0730 阅读(1225) 评论(0) 推荐(0) 编辑

导航