摘要: **发表时间:**2018(ICLR 2018) **文章要点:**这篇文章提出了temporal difference models(TDMs)算法,把goal-conditioned value functions和dynamics model联系起来,建立了model-free和model-b 阅读全文
posted @ 2022-03-19 12:09 initial_h 阅读(104) 评论(0) 推荐(0) 编辑