会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
aaa2222339
博客园
首页
新随笔
联系
管理
订阅
2019年2月4日
强化学习概念
摘要: 0. 强化学习的方法有:Q Learning(基于价值),Sarsa(基于价值),Policy Gradients(基于概率). 1.经验(观察observation,激励reward,行动action) 2.状态(state) 3.马尔科夫决策过程(MDP) 4.大致步骤 5. 计算累计奖励的期望
阅读全文
posted @ 2019-02-04 18:46 Jary霸
阅读(210)
评论(0)
推荐(0)
编辑
公告