摘要: **发表时间:**2020(NeurIPS 2020) **文章要点:**文章发布了一个复杂的强化学习的环境,可以用来研究exploration,planning,language-conditioned RL等等。环境是一个地宫类的游戏,相当于一层一层找门找地道,开地宫然后收集道具打怪兽,最终目标 阅读全文
posted @ 2021-08-01 01:05 initial_h 阅读(113) 评论(0) 推荐(0) 编辑