动态规划 - 矩阵链的乘法问题

这里用矩阵链的乘法问题来说明动态规划算法的设计要素。

\(A_1,A_2,..,A_n\)表示\(n\)个矩阵的序列,其中\(A_i\)\(P_{i-1} \times P_i\)阶矩阵,\(i=1,2,...,n\)
向量\(P=<P_0,P_1,P_2..P_i>\)表示矩阵链的输入,其中\(P_0\)\(A_1\)的行数,\(P_1\)\(A_1\)的列数,\(P_1\)\(A_2\)的行数,以此类推。
计算这个矩阵需要做\(n-1\)次两个矩阵的相乘运算,可以用\(n-1\)对括号表示运算次序。
因为矩阵乘法满足结合律,所以无论采用那种顺序,最后结果都一样,但是采用不同的顺序计算的工作量不同。如何定义两个矩阵相乘的工作量呢?
所以假设\(A_1\)\(i\)\(k\)列,\(A_2\)\(k\)\(j\)列。所以\(A_1\)\(A_2\)相乘后的矩阵有\(i\)\(j\)列,含\(ij\)个元素。
以元素相乘作为基本运算,乘积中每个元素的计算都需要做j次乘法,于是计算\(A_1A_2\)总共需要\(ijk\)次乘法。

1.1具体实例

假设输入的是\(P=<10,100,5,50>\),说明有\(3\)个矩阵相乘。其中,
\(A_1:10 \times 100\)
\(A_2:100\times 50\)
\(A_3:5 \times50\)
有两种乘法次序:
\((A_1A_2)A_3\)
\(A_1(A_2A_3)\)
执行第一种运算的基本运算次序:\(10 \times 100\times5 + 10 \times 5 \times 50=7500\)
执行第二种运算的基本运算次序:\(10 \times 100\times50 + 100 \times 5 \times 50=75000\)
工作量相差达10倍!
所以我们的问题是:给定向量P,确定一种乘法次序,使得基本运算的总次数最少。
蛮力算法时间复杂度太大,这里先不讨论。
我们尝试用动态规划算法,从子问题的划分,递归方程的确定,递归和迭代的实现方法,复杂度分析等方面介绍动态规划算法。

1.2子问题的划分和递推方程

我们的优化目标是:基本运算次数的最小化。
如何界定子问题的边界? 令\(A_i..n\)表示输入的矩阵链。
如果从前向后划分,得\(A_{1..i}\),i=1,2,...,n,得到的子问题只有后边界。但是在计算子问题\(A_{1..j}\),j>i时,我们不仅需要知道子问题\(A_{1..i}\),也得知道\(A_{i+1..j}\)的信息。
这说明子问题的划分需要前后两个边界。
\(A_i..j\)定义矩阵链\(A_i,A_{i+1},..,A_j\)相乘的子问题,\(m[i,j]\)表示得到乘积\(A_{i..j}\)所用到的最小基本运算次数。
假定最后一次乘积发生在矩阵链\(A_{i..k}\)\(A_k+1..j\)之间,即
\(A_iA_{i+1}..A_j=(A_iA_{i+1}..A_k)(A_{k+1}A_{k+2}..A_j)\)
\(k=i,i+1,...,j-1\)
所以子问题\(A_i..j\)的计算依赖于子问题\(A_i..A_k\)\(A_{k+1}..A_j\)的计算结果。
\(m[i,j]\)依赖于\(m[i,k]\)\(m[k+1,j]\)的值。
image
k代表子问题的划分问题,考虑所有可能的划分,\(i<=k<=j\),从中比较出最小的值。
\(P_{i-1}P_kP_j\)是最后把两个子矩阵链\(A_{i..k}\)\(A_{k+1}..j\)的结果矩阵相乘所做的基本运算次数。
\(i=j\)时,矩阵链只有一个矩阵\(A_i\),这时乘法次数是\(0\),对应了递推式的初值。
所以这个问题是满足优化原则的。因为当\(m[i,j]\)达到最小值时,子问题的优化函数值\(m[i,k]\)\(m[k+1,j]\)也是最小的。

2.动态规划算法的递归实现

为了确定每次相乘时加括号的位置,需要设计表\(s[i,j]\)记录\(m[i,j]\)达到最小值时k的划分位置。
算法RecurMatrixChain(P,i,j)
输入:矩阵链\(A_i..j\)的输入为向量\(P=<P_0,P_1,P_2..P_i>\),其中\(i<=k<=j\)
输出:计算\(A_{i..j}\)的所需最小乘法次数\(m[i,j]\)和最后一次运算的位置\(s[i,j]\)

if i=j
then m[i,j] <- 0 ; s[i,j] <- i ; return m[i,j]
m[i,j] <- 无穷
s[i,j] <- i
for k <- i to j-1 do        //考虑所有可能的划分位置
    q <- RecurMatrixChain(P,i,k) + RecurMatrixChain(P,k+1,j) + Pi-1PkPj
    if q < m[i,j]
    then m[i,j] <- q
         s[i,j] <- k
return m[i,j]

求解n个矩阵相乘,只需代入i=1,j=n。
下面考虑时间复杂度
image
算法在行5执行for循环,k从1到n-1。
每次进入循环体都在行6进行两个子问题的递归求解,其余工作量都是常数时间。
化简得:
image

现在介绍一个定理:当\(n>1\)时,

image

证明:\(n=2,T(2)>=C=C_12^{n-1},C_1=C/2\)为某个正数
假设对于任何小于n大于等于2的k,\(T(k)>=C_12^{k-1}\),则存在某个常数C’,使得

image
可以看到,通过使用了动态规划的设计思想,相比于蛮力算法,时间复杂度有所改善,但是并没有得到多项式时间的高效算法。为什么?
以矩阵链\(A_{1..5}\)为例:
image
时间复杂度高的原因:在递归调用中同一个子问题被多次重复计算。
在整个递归计算中总计产生了\(1+8+24+32+16=81\)个子问题。
规模为1的子问题有5个,以此类推,得到不同的子问题个数只有\(5+4+3+2+1=15\)
说明算法计算的81个子问题中有许多是重复的。

3.动态规划算法的迭代实现

迭代计算的关键

  • 每个子问题只计算一遍
  • 迭代过程
    1. 从最小子问题开始
    2. 考虑计算顺序,以保证后面用到的值前面已经计算好
    3. 存储结构保存计算结果--备忘录(存储子问题的优化函数值和划分边界)
  • 解的追踪
    1. 设计标记函数标记每步的决策
    2. 考虑根据标记函数追踪解的算法
      image
      \(r\)为链长
      算法MatrixChain(P,n)
      输入:矩阵链\(A_{1..n}\)的输入向量\(P=<P_0,P_1,P_2..P_i>\)
      输出:计算\(A_{i..j}\)的所需最小乘法次数\(m[i,j]\)和最后一次运算的位置\(s[i,j]\)
令所有的m[i,j]得初值为0
for r<-2 to n do                                //r为链长(子问题规模)
    for i<-1 to n-r+1                           //左边界i,n-r+1是最后一个r链的前边界
        j<-i+r-1                                //右边界
        m[i,j] <- m[i+1,j] + Pi-1PiPj
        s[i,j] <- i
        for k<-i+1 to j-1 do
            t<-m[i,k]+m[k+1,j]+Pi-1PiPj
            if t<m[i,j]
            then m[i,j]<-t
                 s[i,j]<-k

时间复杂度:
行2,3,7都是\(O(n)\),嵌套循环执行\(O(n^3)\)次,内部为\(O(1)\)\(W(n)=O(n^3)\)
image
image
解的追踪:
\(S[1,5]=3 => (A_1A_2A_3)(A_4A_5)\)
\(S[1,3]=1 => A_1(A_2A_3)\)
输出:
计算顺序:\((A_1(A_2A_3))(A_4A_5)\)
最少的乘法次序:\(m[1,5]=11875\)

两种比较的实现:
递归实现:时间复杂度高,空间少
迭代实现:时间复杂度低,空间消耗多

原因:递归实现子问题多次重复计算,子问题计算次数呈指数增长。迭代实现每个子问题只计算一遍。

动态规划时间复杂度:
备忘录各项计算量之和+追踪解的工作量
通常追踪解的工作量不超过计算工作量,是问题规模的多项式函数

4.动态规划算法的要素:

  • 划分子问题,确定子问题边界,将问题求解变成多步判断的过程。
  • 定义优化函数,以该函数极大(或极小)值作为依据,确定是否满足优化原则
  • 列优化函数的递推方程和边界条件。
  • 自底向上计算,设计备忘录(表格)。
  • 考虑是否需要设立标记函数
posted @ 2020-04-03 11:18  HIIM  阅读(2458)  评论(1编辑  收藏  举报