摘要: **发表时间:**2020(ICML) **文章要点:**这篇文章提出Agent57算法,是第一个在所有57个Atari游戏上超过人类表现的算法。主要的思路就是基于Never Give Up (NGU)和R2D2((RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED 阅读全文
posted @ 2022-05-02 23:08 initial_h 阅读(443) 评论(0) 推荐(0) 编辑