摘要: **发表时间:**2022(ICLR2022) **文章要点:**这篇文章基于muzero来度量model-based agent的泛化能力。主要研究了三个因素:planning, self-supervised representation learning, and procedural dat 阅读全文
posted @ 2022-11-25 12:28 initial_h 阅读(35) 评论(0) 推荐(0) 编辑