摘要: **发表时间:**2017(ICML 2017) **文章要点:**这篇文章设计了一个叫Predictron的结构,在abstract的状态上进行学习,通过multiple planning depths来使得model self-consistent,进行端对端的学习。这里的设定是MRP,不是MD 阅读全文
posted @ 2023-04-03 10:48 initial_h 阅读(31) 评论(0) 推荐(0) 编辑