摘要: **发表时间:**2020(ICML 2020) **文章要点:**这篇文章想要先学low-level policy,然后基于low-level policy来训练一些强化的任务,这样就相当于可以用reusable skills来加快下游任务的训练。主要思路是通过模仿学习和联合辅助任务训练来学reu 阅读全文
posted @ 2021-11-14 11:53 initial_h 阅读(128) 评论(0) 推荐(0) 编辑