会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
琳千寻
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2017年6月20日
MDP(MarkovDecisionProcess,马尔卡夫决策树)实现总结
摘要: MDP算法简介:首先MDP算法由五个单元组成(S、A、Psa(s')、R、G) S:代表状态集合,即整个事件有多少中可能的状态 A:代表每个状态下的所有可能的行为 Psa(s'):代表在状态s下采取行为a转移到s'的状态转移概率 R:代表的是回报函数(reward function),指到达某个状态
阅读全文
posted @ 2017-06-20 11:43 琳千寻
阅读(1524)
评论(0)
推荐(0)
编辑