摘要: 注:本节内容是对Sutton的《Reinforcement Learning:An introduction》第八章的理解整理~ 这里是前两节 如何从统一视角来考虑一系列强化学习方法? 稍微整理一下之前分享整理的强化学习思路: 具备完整的环境模型,我们使用贝尔曼方程(解方程或仿真求解)得到状态函数, 阅读全文
posted @ 2021-09-07 16:35 芋圆院长 阅读(280) 评论(0) 推荐(0) 编辑