强化学习Sutton (Reinforcement Learning : An introduction )文章概括和总结

由于需要,在强化学习的学习过程中,本着搞透彻的基本观念,认真研读了Sutton的强化学习圣经 An Introduction。

以下是我在看完3~6章后个人的一些理解,也为了能够理清楚具体的原理,在这篇博客记下来相关内容。

附上链接:

第3章:有限马尔科夫决策过程

第4章:动态规划

第5章:蒙特卡洛方法

第6章:TD方法:包括Sara和Q-learning算法

 

posted @ 2020-04-18 17:22  Respirar  阅读(617)  评论(0编辑  收藏  举报