摘要: **发表时间:**2019(NeurIPS 2019) **文章要点:**这篇文章结合planning和强化学习来解决复杂任务,主要思路是通过强化学习(Goal-conditioned RL)的方式构建一个图结构(graph),图里的节点就包括起始位置,目标位置以及中间点,这就相当于把一个远距离的目 阅读全文
posted @ 2021-11-22 12:42 initial_h 阅读(129) 评论(0) 推荐(0) 编辑