动态规划总结

    动态规划通常应用于最优化问题,即要做出一组选择以达到一个最优解。在做选择的同时,经常出现同样形式的子问题。当某一特定的子问题可能出自于多于一种选择的集合时,动态规划是很有效的。关键技术是存储这些子问题每一个的解,以备它重复出现。

      和分治法一样,动态规划是通过组合子问题的解而解决整个问题的。动态规划适用于子问题不是独立的情况,也就是各子问题包含公共的子子问题。动态规划算法对每个子子问题只求解一次,将其结果保存在一张表中,从而避免每次遇到各个子问题时重新计算答案。

  动态规划通常应用于最优化问题。此类问题可能有很多种可行解。每个解有一个值,而我们希望找出一个具有最优值的解。称这样的解为该问题的"一个"最优解。

  动态规划算法的设计可以分为如下4个步骤:

  1)描述最优解的结构。

  2)递归定义最优解的值。

  3)按自底向上的方式计算最优解的值。

  4)由计算出的结果构造一个最优解。

题目一:

  装配线调度问题。

  步骤1:通过工厂最快路线的结构

  动态规划方法的第一个步骤是描述最优解的结构的特征。对于装配线调度问题,可以如下执行。考虑底盘从起始点到装配站S1,j 的最快可能路线。如果j=1,则底盘能走的只有一条路线,所以很容易就可以确定它到装配站S1,j 花费了多少实际时间。对于j=2,3,...,n,则有两种选择:这个底盘可能从装配站S1,j-1 直接到装配站 S1,j 在相同的装配线上,从装配站j-1到j的时间是可以忽略的。或者,这个底盘可能来自装配站S2,j-1,然后再移动到装配站S1,j ,移动的代价是t2,j-1 。我们将分别考虑这两种可能性,后面可以看到它们之间其实有很多共性的。(找到递推公式)

  首先,假设通过装配站S1,j 的最快路径通过了装配站S1,j -1。关键的一点是这个底盘必定是利用了最快的路线从开始点到装配站S1,j -1。

  类似地,假设通过装配站S1,j 的最快路径通过了装配站S2,j -1。

  更一般地,对于装配线调度问题,一个问题的(找出装配站Si,j 的最快路线)的最优解包含了子问题(找出通过S1,j -1S2,j -1 的最快路线)的一个最优解。我们称这个性质为最优子结构,这是是否可以应用动态规划方法的标志之一。

  下面利用最优子结构来说明:观察一条通过装配站S1,j的最快路线,会发现它必定是经过装配线1或2上的装配站j-1.因此,通过装配站S1,j的最快线路只能是一下二者之一:

  通过装配站S1,j -1的最快线路,然后直接通过装配站S1,j 。

  通过装配站S2,j -1的最快线路,从装配线2移动到装配线1,然后通过装配站S1,j 

  利用对称的推理思想,通过装配站S2,j的最快路线,也只能是二者之一。

  通过装配站S2,j -1的最快线路,然后直接通过装配站S2,j 。

  通过装配站S1,j -1的最快线路,从装配线1移动到装配线2,然后通过装配站S2,j 

  为了解决这个问题,即寻找通过任一条装配线上的装配站j的最快路线,我们解决它的子问题,即寻找通过两条装配线上的装配站j-1的最快路线。

  所以,对于装配线调度问题,通过建立子问题的最优解,就可以建立原问题某个实例的一个最优解了。

  步骤2:一个递归的解

  在动态规划方法中,第二个步骤是利用子问题的最优解来递归定义一个最优解的值。对于装配线的调度问题,对于装配线的调度问题,我们选择在两条装配线上通过装配站j的最快线路作为子问题,j=1,2...,n。令fi[j]表示一个底盘从起点到装配站S1,j的最快可能时间。

  我们的最终目标是确定底盘通过工程的所有路线的最快时间,记为f*。底盘必须一路经由装配线1或2通过装配站n,然后到达工厂的出口。所以:

  f* = min{f1[j] + x1, f2[j] + x2}

  然后开始考虑边界条件。

  要对f1[1] 和f2[2]进行推理也很容易的。不管在哪一条装配线上通过装配站1,底盘都是直接到达该装配站的。于是

  f1[1] = e1 + a1,1

  f2[2] = e2 + a2,1

  正式考虑:

  现在来考虑如何计算f1[j],其中j=2,3,...,n(i = 1,2)。

  第一种情况f1[j] = f1[j - 1] + a1,j

  第二种情况f1[j] = f2[j - 1] + t2,j-1 + a1,j

  同理:

  对于第二条装配线: 

  第一种情况f2[j] = f2[j - 1] + a1,j

 

  第二种情况f2[j] = f1[j - 1] + t1,j-1 + a2,j

考虑边际情况和一般情况后得出递归公式:

  略

  fi[j]的值就是子问题最优的值。为了有助于跟踪最优解的构造过程,我们定义li[j]为装配线的编号(1或2),其中的装配站j-1被通过装配站Si[j]的最快路线所使用。这里,i=1,2且j=2,3,...,n。我们避免定义li[1],因为在任一条装配线上都没有一个装配站在站1前面)。此外,还定义L*为这样的装配线,其内的装配站n被通过整个工厂的最快线路所使用。(就是一个装配站的数组,路过的)li[j]的值可以帮助找到一个最快的路线。从L*=1开始,使用装配站S1,6 。现在看到li[6]值为2,所以使用装配站S2,5 。

  步骤3:计算最快时间

  此时,写出一个递归算法来计算通过工厂的最快路径是一件简单的事情。这种递归算法有一个问题:它执行时间是关于n的指数形式。

posted @ 2016-04-30 22:06  Friday92  阅读(552)  评论(0编辑  收藏  举报