强化学习

REF:强化学习——从Q-Learning到DQN到底发生了什么?

概念

时间差分法(TD方法)

强化学习入门 第四讲 时间差分法(TD方法)

强化学习(五) - 时序差分学习(Temporal-Difference Learning)及其实例----Sarsa算法, Q学习, 期望Sarsa算法 

posted @ 2022-01-03 17:58  lvmxh  阅读(75)  评论(0编辑  收藏  举报