摘要:
**发表时间:**2020 **文章要点:**文章提出了一个叫BeBold(Beyond the Boundary of explored regions)的新的count-based的探索方法,缓解了short-sightedness and detachment的问题,在MiniGrid和Net 阅读全文
摘要:
**发表时间:**2018(AAAI-19 Workshop on Reinforcement Learning in Games) **文章要点:**结合了A3C和MCTS,再加上一个预测terminal的辅助任务的loss,在Pommerman上取得了不错的效果。主要的方法就是在A3C的work 阅读全文