2019 年 1月 23 日随笔档案 - yijun0730

2019年1月23日

6. Double DQN、Prioritized DQN、Dueling DQN

摘要：本篇介绍三种DQN的变体，分别是从参数更新部分改进的Double DQN，从经验回放部分改进的Prioritized DQN，从神经网络结构部分改进的Dueling DQN。 Double DQN 上一篇提到的DQN是基于Q-learning，更新也是基于贪婪算法，$Q \leftarrow Q + 阅读全文

posted @ 2019-01-23 20:41 yijun0730 阅读(1225) 评论(0) 推荐(0) 编辑

yijun0730

6. Double DQN、Prioritized DQN、Dueling DQN

导航