杭电acm step 动态规划专题总结(1)简单的动态规划问题

几个概念:

多阶段决策问题:如果一类过程可以分成若干个相互联系的阶段,在每一个阶段都需要做出决策,一个阶段的决策确定了以后,常常影响到下一个阶段的决策,从而就完全确定了一个活动的活动路线,则称其为多阶段决策问题。

策略:多个阶段的决策序列构成一个决策序列称为策略。多阶段的决策问题,就是要在选择的那些策略中间,选择一个最优策略,使在预定的标准下达到最好的效果。

阶段:把求解问题分成若干个阶段,以便于求解。多数情况下,阶段变量是离散的,用k表示,如果过程可以在任何时刻做出决策,且在任意两个不同的时刻之间允许有无穷多个决策    时,阶段变量就是连续的。

状态:表示每个阶段开始面临的自然状况或客观条件,它既是某阶段的终点,又是后一个阶段的起点。

无后效性:如果给定某一个阶段的状态,则在这一阶段以后过程的发展不受这个阶段以前各阶段的影响,所有的各阶段都确定时,整个过程都确定了。状态的这个性质意味着过程的历史只能通过当前的状态去影响它未来的发展,这个性质称为无后效性。

决策:一个阶段的状态给定以后,从该状态演变到下一个阶段某个状态的一种选择称为决策。描述决策的变量称为决策变量。状态满足无后效性,每个状态选择决策时只需要考虑当    前状态而无需考虑过程的历史。

策略:由每个阶段的决策组成的序列称为策略。

最优性原理:作为整个过程的最优策略,它满足:相对前面的决策所形成的的状态而言,余下的子策略必然构成最子优策略。

 

posted @ 2013-11-01 20:26  湖心北斗  阅读(751)  评论(0编辑  收藏  举报