动态规划(Dynamic Programming, DP)
作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/
动态规则是运筹学的一个分支, 它是解决多阶段决策过程最优化的一种数学方法。大约产生于20世纪50年代。1951年美国数学家贝尔曼(R .Bellman)等人, 根据一类多阶段决策问题的特点, 把多阶段决策问题变换为一系列互相联系的单阶段问题, 然后逐个加以解决。与此同时, 他提出了解决这类问题的“最优性原理”, 研究了许多实际问题, 从而创建了解决最优化问题的一种新的方法——动态规划(Dynamic Programming, DP)。他的名著“动态规划”于1957年出版, 该书是动态规划的第一本著作。
动态规划模型的分类, 根据多阶段决策过程的时间参量是离散的还是连续的变量, 过程分为离散决策过程和连续决策过程。根据决策过程的演变是确定性的还是随机性的, 过程又可分为确定性决策过程和随机性决策过程。组合起来就有离散确定性、离散随机性、连续确定性、连续随机性四种决策过程模型。本博客主要参考[1], 研究离散决策过程, 介绍动态规划的基本概念、理论和方法, 并通过最短路线问题来说明它的应用。
1. 问题陈述——最短路线问题及穷举法求解
2. 动态规划求解
3. 动态规划 vs 穷举法
4. 参考文献
[1]《运筹学》教材编写组. 运筹学(第三版)[M]. 清华大学出版社, 2005.