2019 年 4月 13 日随笔档案 - 最后的战役aag

2019年4月13日

摘要：１　DQN的引入由于q_learning算法是一直更新一张q_table，在场景复杂的情况下，q_table就会大到内存处理的极限，而且在当时深度学习的火热，有人就会想到能不能将从深度学习中借鉴方法，将深度学习的方法应用到强化学习中。13年，谷歌的deepmind团队就发表了关于DQN算法的论文，阅读全文

posted @ 2019-04-13 14:32 最后的战役aag 阅读(784) 评论(0) 推荐(0) 编辑

孙卓文Vincent

公告