摘要: **发表时间:**2021 (NeurIPS 2021) **文章要点:**这篇文章提出了一个Heuristic-Guided Reinforcement Learning (HuRL)的框架,用domain knowledge或者offline data构建heuristic,将问题变成一个sho 阅读全文
posted @ 2023-05-06 23:30 initial_h 阅读(85) 评论(0) 推荐(1) 编辑