算法分析与设计——矩阵连乘问题
问题描述:
给定n个矩阵:A1,A2,...,An,其中Ai与Ai+1是可乘的,i=1,2...,n-1。确定计算矩阵连乘积的计算次序,使得依此次序计算矩阵连乘积需要的数乘次数最少。输入数据为矩阵个数和每个矩阵规模,输出结果为计算矩阵连乘积的计算次序和最少数乘次数。
问题解析:
由于矩阵乘法满足结合律,故计算矩阵的连乘积可以有许多不同的计算次序。这种计算次序可以用加括号的方式来确定。若一个矩阵连乘积的计算次序完全确定,也就是说该连乘积已完全加括号,则可以依此次序反复调用2个矩阵相乘的标准算法计算出矩阵连乘积。
完全加括号的矩阵连乘积可递归地定义为:
(1)单个矩阵是完全加括号的;
(2)矩阵连乘积A是完全加括号的,则A可表示为2个完全加括号的矩阵连乘积B和C的乘积并加括号,即A=(BC)
例如,矩阵连乘积A1A2A3A4有5种不同的完全加括号的方式:(A1(A2(A3A4))),(A1((A2A3)A4)),((A1A2)(A3A4)),((A1(A2A3))A4),(((A1A2)A3)A4)。每一种完全加括号的方式对应于一个矩阵连乘积的计算次序,这决定着作乘积所需要的计算量。
看下面一个例子,计算三个矩阵连乘{A1,A2,A3};维数分别为10*100 , 100*5 , 5*50 按此顺序计算需要的次((A1*A2*A3):10X100X5+10X5X50=7500次,按此顺序计算需要的次数(A1*(A2*A3)):10*5*50+10*100*50=75000次
所以问题是:如何确定运算顺序,可以使计算量达到最小化。
算法思路:
例:设要计算矩阵连乘乘积A1A2A3A4A5A6,其中各矩阵的维数分别是:
A1:30*35; A2:35*15; A3:15*5; A4:5*10; A5:10*20; A6:20*25
递推关系:
设计算A[i:j],1≤i≤j≤n,所需要的最少数乘次数m[i,j],则原问题的最优值为m[1,n]。
当i=j时,A[i:j]=Ai,因此,m[i][i]=0,i=1,2,…,n
当i<j时,若A[i:j]的最优次序在Ak和Ak+1之间断开,i<=k<j,则:m[i][j]=m[i][k]+m[k+1][j]+pi-1*pk*pj。由于在计算是并不知道断开点k的位置,所以k还未定。不过k的位置只有j-i个可能。因此,k是这j-i个位置使计算量达到最小的那个位置。
综上,有递推关系如下:
计算最优值:
用动态规划算法解此问题时,可依据其递归式以自底向上的方式进行计算。在计算过程中,保存以解决的子问题的答案,每个子问题只计算一次,而在后面用到时只需要简单查一下,避免了大量的重复计算,最后得到了多项式时间的算法。
代码如下:
1 void matrixChain(int p[],int m[][],int s[][]) 2 //p用来记录矩阵,m[i][j]表示第i个矩阵到第j个矩阵的最优解,s[][]记录从哪里断开可以得到最优解 3 { 4 int n=len-1; 5 for(int i=1; i<=n; i++)//初始化数组 6 m[i][j]=0; 7 for(int r=2; r<=n; r++)//对角线循环 8 { 9 for(int i=1; i<=n-r+1; i++) //行循环 10 { 11 int j=i+r-1;//列的控制 12 m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值,初始化使k=i; 13 s[i][j]=i; 14 for(int k=i+1; k<j; k++) 15 { 16 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j]; 17 if(t<m[i][j]) 18 { 19 s[i][j]=k;//在k位置断开得到最优解 20 m[i][j]=t; 21 } 22 } 23 } 24 } 25 }
构造最优解:
若将对应m[i][j]的断开位置k记为s[i][j],在计算出最优值m[i][j]后,可递归地由s[i][j]构造出相应的最优解。s[i][j]中的数表明,计算矩阵链A[i:j]的最佳方式应在矩阵Ak和Ak+1之间断开,即最优的加括号方式应为(A[i:k])(A[k+1:j)。因此,从s[1][n]记录的信息可知计算A[1:n]的最优加括号方式为(A[1:s[1][n]])(A[s[1][n]+1:n]),进一步递推,A[1:s[1][n]]的最优加括号方式为(A[1:s[1][s[1][n]]])(A[s[1][s[1][n]]+1:s[1][s[1][n]]])。同理可以确定A[s[1][n]+1:n]的最优加括号方式在s[s[1][n]+1][n]处断开...照此递推下去,最终可以确定A[1:n]的最优完全加括号方式,及构造出问题的一个最优解。
代码如下:
1 void traceback(int s[][],int i,int j) 2 { 3 if(i==j) 4 retiurn; 5 traceback(s,i,s[i][j]); 6 traceback(s,s[i][j]+1,j); 7 cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl; 8 }
完整代码如下:
1 #include<stdio.h> 2 #include<iostream> 3 #include<algorithm> 4 #include<stdlib.h> 5 using namespace std; 6 const int MAX = 100; 7 int n; 8 int p[MAX+1],m[MAX][MAX],s[MAX][MAX]; 9 //p用来记录矩阵,m[i][j]表示第i个矩阵到第j个矩阵的最优解,s[][]记录从哪里断开可以得到最优解 10 void matrixChain() 11 { 12 for(int i=1; i<=n; i++)//初始化数组 13 m[i][i]=0; 14 for(int r=2; r<=n; r++)//对角线循环 15 { 16 for(int i=1; i<=n-r+1; i++) //行循环 17 { 18 int j=i+r-1;//列的控制 19 m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值,初始化使k=i; 20 s[i][j]=i; 21 for(int k=i+1; k<j; k++) 22 { 23 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j]; 24 if(t<m[i][j]) 25 { 26 s[i][j]=k;//在k位置断开得到最优解 27 m[i][j]=t; 28 } 29 } 30 } 31 } 32 } 33 void traceback(int i,int j) 34 { 35 if(i==j) 36 return; 37 traceback(i,s[i][j]); 38 traceback(s[i][j]+1,j); 39 cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl; 40 } 41 int main() 42 { 43 cin>>n; 44 for(int i=0; i<=n; i++) 45 cin>>p[i]; 46 matrixChain(); 47 traceback(1,n); 48 cout<<m[1][n]<<endl; 49 return 0; 50 }
输出结果如下: