2021 年 9月 7 日随笔档案 - 芋圆院长

2021年9月7日

摘要：注：本节内容是对Sutton的《Reinforcement Learning：An introduction》第八章的理解整理~ 这里是前两节如何从统一视角来考虑一系列强化学习方法？稍微整理一下之前分享整理的强化学习思路：具备完整的环境模型，我们使用贝尔曼方程（解方程或仿真求解）得到状态函数，阅读全文

posted @ 2021-09-07 16:35 芋圆院长阅读(280) 评论(0) 推荐(0) 编辑

芋圆院长

公告