摘要: **发表时间:**2020 **文章要点:**这篇文章主要是deep的model based RL的综述,说起来主要的目标就是一句话achieve high predictive power while maintaining low sample complexity. 主要分了三大类using 阅读全文
posted @ 2022-02-26 13:10 initial_h 阅读(69) 评论(0) 推荐(0) 编辑