会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
LGL-sdu
博客园
首页
新随笔
联系
订阅
管理
2024年2月26日
Reinforcement Learning Charpter 3
摘要: 本文参考《Reinforcement Learning:An Introduction(2nd Edition)》Sutton 有限MDP 有限MDP在RL中一般就是指如下图的交互式学习框架。(为了方便起见,把它当成离散化的过程) 其“有限”的特点表现在:state、reward、action三者只
阅读全文
posted @ 2024-02-26 16:07 llllllgllllll
阅读(4)
评论(0)
推荐(0)
编辑
公告