摘要: #基于模型的动态规划算法 动态规划方法的动态一词指的是问题的顺序或时间组成部分,规划一词指优化一个“程序”,即策略。动态规划是解决复杂问题的一种方法。复杂问题可以分解为很多子问题,解决子问题并把这些子问题结合一起。 动态规划假定完全了解MDP,即已知环境模型。可以用于一个MDP的规划。 动态规划(D 阅读全文
posted @ 2020-08-04 14:54 feifanren 阅读(532) 评论(0) 推荐(0) 编辑