随笔档案「2016年7月11日」：论文阅读之：PRIORITIZED EXPERIENCE REPLAY ... - AHU-WangXiao

2016年7月11日

摘要： PRIORITIZED EXPERIENCE REPLAY ICLR 2016 经验回放使得 online reinforcement learning agent 能够记住并且回放过去的经验。在先前的工作中，从回放记忆中随机的采样 experience transitions。但是，这种方法简单的阅读全文

posted @ 2016-07-11 14:49 AHU-WangXiao 阅读(6771) 评论(0) 推荐(0)

The Blog of Xiao Wang

Associate Professor, School of Computer Science and Technology, Anhui University, Email: xiaowang@ahu.edu.cn

公告