强化学习Sutton （Reinforcement Learning ： An introduction ）文章概括和总结

由于需要，在强化学习的学习过程中，本着搞透彻的基本观念，认真研读了Sutton的强化学习圣经 An Introduction。

以下是我在看完3~6章后个人的一些理解，也为了能够理清楚具体的原理，在这篇博客记下来相关内容。

附上链接：

第3章：有限马尔科夫决策过程

第4章：动态规划

第5章：蒙特卡洛方法

第6章：TD方法：包括Sara和Q-learning算法

posted @ 2020-04-18 17:22 Respirar 阅读(692) 评论(0) 收藏举报

刷新页面返回顶部