摘要: 之前的所有文章基于环境动力学规则,即状态转移概率$P_{ss'}^a$已知的情况下分析的,而在实际的更多情况下,环境动力学未知,不知道状态转移概率,这一类问题被称为无模型问题。本篇文章主要是介绍基于完整采样的蒙特卡罗强化学习。 主要的学习资源是五个: B站许志钦老师的视频(主要入门理论)https: 阅读全文
posted @ 2022-03-12 22:10 静候佳茵 阅读(66) 评论(0) 推荐(0) 编辑