强化学习

REF：强化学习——从Q-Learning到DQN到底发生了什么？

概念

时间差分法（TD方法）

强化学习入门第四讲时间差分法（TD方法）

强化学习（五） - 时序差分学习(Temporal-Difference Learning)及其实例----Sarsa算法, Q学习, 期望Sarsa算法

posted @ 2022-01-03 17:58 lvmxh 阅读(132) 评论(0) 收藏举报

刷新页面返回顶部