摘要: **发表时间:**2019(ICML 2019) **文章要点:**这篇文章想说如果replay的经验和当前的policy差别很大的话,对更新是有害的。然后提出了Remember and Forget Experience Replay (ReF-ER)算法,(1)跳过那些和当前policy差别很大 阅读全文
posted @ 2023-07-02 12:15 initial_h 阅读(28) 评论(0) 推荐(0) 编辑