算法分析与设计——矩阵连乘问题

问题描述

  给定n个矩阵:A1,A2,...,An,其中Ai与Ai+1是可乘的,i=1,2...,n-1。确定计算矩阵连乘积的计算次序,使得依此次序计算矩阵连乘积需要的数乘次数最少。输入数据为矩阵个数和每个矩阵规模,输出结果为计算矩阵连乘积的计算次序和最少数乘次数。

 问题解析:

  由于矩阵乘法满足结合律,故计算矩阵的连乘积可以有许多不同的计算次序。这种计算次序可以用加括号的方式来确定。若一个矩阵连乘积的计算次序完全确定,也就是说该连乘积已完全加括号,则可以依此次序反复调用2个矩阵相乘的标准算法计算出矩阵连乘积。

       完全加括号的矩阵连乘积可递归地定义为:

     (1)单个矩阵是完全加括号的;

     (2)矩阵连乘积A是完全加括号的,则A可表示为2个完全加括号的矩阵连乘积B和C的乘积并加括号,即A=(BC)

       例如,矩阵连乘积A1A2A3A4有5种不同的完全加括号的方式:(A1(A2(A3A4))),(A1((A2A3)A4)),((A1A2)(A3A4)),((A1(A2A3))A4),(((A1A2)A3)A4)。每一种完全加括号的方式对应于一个矩阵连乘积的计算次序,这决定着作乘积所需要的计算量。

      看下面一个例子,计算三个矩阵连乘{A1,A2,A3};维数分别为10*100 , 100*5 , 5*50 按此顺序计算需要的次((A1*A2*A3):10X100X5+10X5X50=7500次,按此顺序计算需要的次数(A1*(A2*A3)):10*5*50+10*100*50=75000次

      所以问题是:如何确定运算顺序,可以使计算量达到最小化。      

 

算法思路

      例:设要计算矩阵连乘乘积A1A2A3A4A5A6,其中各矩阵的维数分别是:

      A1:30*35;     A2:35*15;     A3:15*5;     A4:5*10;     A5:10*20;     A6:20*25 

 

      递推关系

      设计算A[i:j],1≤i≤j≤n,所需要的最少数乘次数m[i,j],则原问题的最优值为m[1,n]。

      当i=j时,A[i:j]=Ai,因此,m[i][i]=0,i=1,2,…,n
      当i<j时,若A[i:j]的最优次序在Ak和Ak+1之间断开,i<=k<j,则:m[i][j]=m[i][k]+m[k+1][j]+pi-1*pk*pj。由于在计算是并不知道断开点k的位置,所以k还未定。不过k的位置只有j-i个可能。因此,k是这j-i个位置使计算量达到最小的那个位置。

      综上,有递推关系如下:

          

  计算最优值:

     用动态规划算法解此问题时,可依据其递归式以自底向上的方式进行计算。在计算过程中,保存以解决的子问题的答案,每个子问题只计算一次,而在后面用到时只需要简单查一下,避免了大量的重复计算,最后得到了多项式时间的算法。

  代码如下:

 1 void matrixChain(int p[],int m[][],int s[][])
 2 //p用来记录矩阵,m[i][j]表示第i个矩阵到第j个矩阵的最优解,s[][]记录从哪里断开可以得到最优解
 3 {
 4     int n=len-1;
 5     for(int i=1; i<=n; i++)//初始化数组
 6         m[i][j]=0;
 7     for(int r=2; r<=n; r++)//对角线循环
 8     {
 9         for(int i=1; i<=n-r+1; i++) //行循环
10         {
11             int j=i+r-1;//列的控制
12             m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值,初始化使k=i;
13             s[i][j]=i;
14             for(int k=i+1; k<j; k++)
15             {
16                 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j];
17                 if(t<m[i][j])
18                 {
19                     s[i][j]=k;//在k位置断开得到最优解
20                     m[i][j]=t;
21                 }
22             }
23         }
24     }
25 }

  
构造最优解

      若将对应m[i][j]的断开位置k记为s[i][j],在计算出最优值m[i][j]后,可递归地由s[i][j]构造出相应的最优解。s[i][j]中的数表明,计算矩阵链A[i:j]的最佳方式应在矩阵Ak和Ak+1之间断开,即最优的加括号方式应为(A[i:k])(A[k+1:j)。因此,从s[1][n]记录的信息可知计算A[1:n]的最优加括号方式为(A[1:s[1][n]])(A[s[1][n]+1:n]),进一步递推,A[1:s[1][n]]的最优加括号方式为(A[1:s[1][s[1][n]]])(A[s[1][s[1][n]]+1:s[1][s[1][n]]])。同理可以确定A[s[1][n]+1:n]的最优加括号方式在s[s[1][n]+1][n]处断开...照此递推下去,最终可以确定A[1:n]的最优完全加括号方式,及构造出问题的一个最优解。

代码如下:

 

1 void traceback(int s[][],int i,int j)
2 {
3     if(i==j)
4         retiurn;
5     traceback(s,i,s[i][j]);
6     traceback(s,s[i][j]+1,j);
7     cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl;
8 }

 

完整代码如下:

 1 #include<stdio.h>
 2 #include<iostream>
 3 #include<algorithm>
 4 #include<stdlib.h>
 5 using namespace std;
 6 const int MAX = 100;
 7 int n;
 8 int p[MAX+1],m[MAX][MAX],s[MAX][MAX];
 9 //p用来记录矩阵,m[i][j]表示第i个矩阵到第j个矩阵的最优解,s[][]记录从哪里断开可以得到最优解
10 void matrixChain()
11 {
12     for(int i=1; i<=n; i++)//初始化数组
13         m[i][i]=0;
14     for(int r=2; r<=n; r++)//对角线循环
15     {
16         for(int i=1; i<=n-r+1; i++) //行循环
17         {
18             int j=i+r-1;//列的控制
19             m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值,初始化使k=i;
20             s[i][j]=i;
21             for(int k=i+1; k<j; k++)
22             {
23                 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j];
24                 if(t<m[i][j])
25                 {
26                     s[i][j]=k;//在k位置断开得到最优解
27                     m[i][j]=t;
28                 }
29             }
30         }
31     }
32 }
33 void traceback(int i,int j)
34 {
35     if(i==j)
36         return;
37     traceback(i,s[i][j]);
38     traceback(s[i][j]+1,j);
39     cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl;
40 }
41 int main()
42 {
43     cin>>n;
44     for(int i=0; i<=n; i++)
45         cin>>p[i];
46     matrixChain();
47     traceback(1,n);
48     cout<<m[1][n]<<endl;
49     return 0;
50 }

输出结果如下:

 

posted @ 2015-05-03 17:53  PJQOOO  阅读(20836)  评论(0编辑  收藏  举报