摘要: PRIORITIZED EXPERIENCE REPLAY ICLR 2016 经验回放使得 online reinforcement learning agent 能够记住并且回放过去的经验。在先前的工作中,从回放记忆中随机的采样 experience transitions。但是,这种方法简单的 阅读全文
posted @ 2016-07-11 14:49 AHU-WangXiao 阅读(6613) 评论(0) 推荐(0) 编辑