摘要: **发表时间:**2020 **文章要点:**这篇文章是篇综述,主要从RL和planning的异同入手,总结了对解决MDP这类问题的公共因素,放到一起称作framework for reinforcement learning and planning (FRAP)的框架。首先文章提出,RL和pla 阅读全文
posted @ 2022-04-12 07:21 initial_h 阅读(96) 评论(0) 推荐(0) 编辑