2023 年 5月 6 日随笔档案 - initial_h

2023年5月6日

摘要： **发表时间：**2021 (NeurIPS 2021) **文章要点：**这篇文章提出了一个Heuristic-Guided Reinforcement Learning (HuRL)的框架，用domain knowledge或者offline data构建heuristic，将问题变成一个sho 阅读全文

posted @ 2023-05-06 23:30 initial_h 阅读(85) 评论(0) 推荐(1) 编辑

initial_h

https://github.com/initial-h

公告