会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
feifanren
博客园
首页
新随笔
联系
订阅
管理
2020年8月4日
强化学习学习笔记(二)-基于模型的动态规划方法
摘要: #基于模型的动态规划算法 动态规划方法的动态一词指的是问题的顺序或时间组成部分,规划一词指优化一个“程序”,即策略。动态规划是解决复杂问题的一种方法。复杂问题可以分解为很多子问题,解决子问题并把这些子问题结合一起。 动态规划假定完全了解MDP,即已知环境模型。可以用于一个MDP的规划。 动态规划(D
阅读全文
posted @ 2020-08-04 14:54 feifanren
阅读(532)
评论(0)
推荐(0)
编辑
公告