会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
水奈樾
博客园
首页
新随笔
联系
管理
2020年1月26日
【强化学习RL】model-free的prediction和control — MC, TD(λ), SARSA, Q-learning等
摘要: 本系列强化学习内容来源自对David Silver课程的学习 课程链接http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html 在上一文介绍了RL基础概念和MDP后,本文介绍了在model-free情况下(即不知道回报Rs和状态转移矩阵Pss
阅读全文
posted @ 2020-01-26 12:56 水奈樾
阅读(1610)
评论(0)
推荐(0)
编辑
公告