2023 年 4月 23 日随笔档案 - initial_h

2023年4月23日

Learning Off-Policy with Online Planning

摘要： **发表时间：**2021（CoRL 2021） **文章要点：**这篇文章提出Off-Policy with Online Planning (LOOP)算法，将H-step lookahead with a learned model和terminal value function learne 阅读全文

posted @ 2023-04-23 12:56 initial_h 阅读(34) 评论(0) 推荐(0) 编辑

initial_h

https://github.com/initial-h

公告