会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Alex Logs
知 行 合 一
博客园
首页
新随笔
联系
订阅
管理
2020年9月24日
马尔科夫决策过程
摘要: INTRO 马尔科夫决策过程(Markov Decision Process)是决策理论规划、强化学习等的一种直观和基本的模型。在这个模型中,环境通过一组状态和动作进行建模,然后被执行以控制系统的状态。通过这种方式控制系统的目的是最大化一个模型的性能指标。这其中的很多问题都可以通过马尔科夫决策过程建
阅读全文
posted @ 2020-09-24 23:42 TuringM
阅读(610)
评论(0)
推荐(0)
编辑
公告