Fork me on GitHub
摘要: 1 DQN的引入 由于q_learning算法是一直更新一张q_table,在场景复杂的情况下,q_table就会大到内存处理的极限,而且在当时深度学习的火热,有人就会想到能不能将从深度学习中借鉴方法,将深度学习的方法应用到强化学习中。13年,谷歌的deepmind团队就发表了关于DQN算法的论文, 阅读全文
posted @ 2019-04-13 14:32 最后的战役aag 阅读(784) 评论(0) 推荐(0) 编辑