刚做了一道矩阵快速幂的题,看了网上不少资料,决定整理一下,接下来再做的时候也可以参考。从网上各位大神那边直接copy过来的
矩阵的快速幂是用来高效地计算矩阵的高次方的。将朴素的o(n)的时间复杂度,降到log(n)。
这里先对原理(主要运用了矩阵乘法的结合律)做下简单形象的介绍:
一般一个矩阵的n次方,我们会通过连乘n-1次来得到它的n次幂。
但做下简单的改进就能减少连乘的次数,方法如下:
把n个矩阵进行两两分组,比如:A*A*A*A*A*A => (A*A)*(A*A)*(A*A)
这样变的好处是,你只需要计算一次A*A,然后将结果(A*A)连乘自己两次就能得到A^6,即(A*A)^3=A^6。算一下发现这次一共乘了3次,少于原来的5次。
其实大家还可以取A^3作为一个基本单位。原理都一样:利用矩阵乘法的结合律,来减少重复计算的次数。
以上都是取一个具体的数来作为最小单位的长度,这样做虽然能够改进效率,但缺陷也是很明显的,取个极限的例子(可能有点不恰当,但基本能说明问题),当n无穷大的时候,你现在所取的长度其实和1没什么区别。所以就需要我们找到一种与n增长速度”相适应“的”单位长度“,那这个长度到底怎么去取呢???这点是我们要思考的问题。
有了以上的知识,我们现在再来看看,到底怎么迅速地求得矩阵的N次幂。
既然要减少重复计算,那么就要充分利用现有的计算结果咯!~怎么充分利用计算结果呢???这里考虑二分的思想。。
大家首先要认识到这一点:任何一个整数N,都能用二进制来表示。。这点大家都应该知道,但其中的内涵真的很深很深(这点笔者感触很深,在文章的最后,我将谈谈我对的感想)!!
计算机处理的是离散的信息,都是以0,1来作为信号的处理的。可想而知二进制在计算机上起着举足轻重的地位。它能将模拟信号转化成数字信号,将原来连续的实际模型,用一个离散的算法模型来解决。 好了,扯得有点多了,不过相信这写对下面的讲解还是有用的。
回头看看矩阵的快速幂问题,我们是不是也能把它离散化呢?比如A^19 => (A^16)*(A^2)*(A^1),显然采取这样的方式计算时因子数将是log(n)级别的(原来的因子数是n),不仅这样,因子间也是存在某种联系的,比如A^4能通过(A^2)*(A^2)得到,A^8又能通过(A^4)*(A^4)得到,这点也充分利用了现有的结果作为有利条件。下面举个例子进行说明:
现在要求A^156,而156(10)=10011100(2)
也就有A^156=>(A^4)*(A^8)*(A^16)*(A^128) 考虑到因子间的联系,我们从二进制10011100中的最右端开始计算到最左端。细节就说到这,下面给核心代码:
1 while(N) 2 { 3 if(N&1) 4 res=res*A; 5 n>>=1; 6 A=A*A; 7 }
里面的乘号,是矩阵乘的运算,res是结果矩阵。
第3行代码每进行一次,二进制数就少了最后面的一个1。二进制数有多少个1就第3行代码就执行多少次。
好吧,矩阵快速幂的讲解就到这里吧。在文章我最后给出我实现快速幂的具体代码(代码以3*3的矩阵为例)。
现在我就说下我对二进制的感想吧:
我们在做很多”连续“的问题的时候都会用到二进制将他们离散简化
1.多重背包问题
2.树状数组
3.状态压缩DP
……………还有很多。。。究其根本还是那句话:化连续为离散。。很多时候我们并不是为了解决一个问题而使用二进制,更多是时候是为了优化而使用它。所以如果你想让你的程序更加能适应大数据的情况,那么学习学习二进制及其算法思想将会对你有很大帮助。
1//整数的快速幂 m^n % k 的快速幂:
1 long long quickpow(long long m , long long n , long long k){ 2 long long ans = 1; 3 while(n){ 4 if(n&1)//如果n是奇数 5 ans = (ans * m) % k; 6 n = n >> 1;//位运算“右移1类似除1” 7 m = (m * m) % k; 8 } 9 return ans; 10 }
2矩阵快速幂:
定义一个矩阵类,例如求(A^n)%mod
1 class Matrix { 2 public: 3 4 long long m[MAXN][MAXN]; 5 //二维数组存放矩阵 6 Matrix(){} 7 //对数组的初始化 8 void init(long long num[MAXN][MAXN]){ 9 for(int i = 0 ; i < MAXN ; i++){ 10 for(int j = 0 ; j < MAXN ; j++){ 11 m[i][j] = num[i][j]; 12 } 13 } 14 } 15 //重载矩阵的乘法运算 16 17 friend Matrix operator*(Matrix &m1 ,Matrix &m2) { 18 int i, j, k; 19 Matrix temp; 20 for (i = 0; i < MAXN; i++) { 21 for (j = 0; j < MAXN; j++) { 22 temp.m[i][j] = 0; 23 for(k = 0 ; k < MAXN ; k++) 24 temp.m[i][j] += (m1.m[i][k] * m2.m[k][j])%mod 25 temp.m[i][j] %= mod; 26 //注意每一步都进行取模 27 } 28 } 29 return temp; 30 } 31 //矩阵的快速幂 32 33 friend Matrix quickpow(Matrix &M , long long n){ 34 Matrix tempans; 35 //初始化为单位矩阵 36 //初始化 37 for(int i = 0 ; i < MAXN ; i++){ 38 for(int j = 0 ; j < MAXN ; j++){ 39 if(i == j) 40 tempans.m[i][j] = 1; 41 else 42 tempans.m[i][j] = 0; 43 } 44 } 45 //快速幂(类似整数) 46 while(n){ 47 if(n & 1) www.2cto.com 48 tempans = tempans * M; 49 //已经重载了* 50 n = n >> 1; 51 M = M * M; 52 } 53 return tempans; 54 } 55 }; 56 57 int main() { 58 Matrix A , ans; 59 long long T , n , k , sum; 60 //数据类型为long long 61 long long num[MAXN][MAXN]; 62 //输入的数据存入数组 63 scanf("%lld" , &T); 64 while(T--){ 65 scanf("%lld%lld/n", &n , &k); 66 memset(num , 0 , sizeof(num)); 67 for(int i = 0 ; i < n ; i++){ 68 for(int j = 0 ; j < n ; j++) 69 scanf("%lld" , &num[i][j]); 70 } 71 A.init(num);//初始化A矩阵 72 ans = quickpow(A , k);//求出矩阵的快速幂 73 } 74 }
最后,还有刚哥整理的,链接
芳姐的矩阵快速幂的模板
1 利用快速幂的思想 根据矩阵的结合律 可以递归二分求解 2 3 struct Mat 4 { 5 int mat[N][N]; 6 }; 7 int n; 8 Mat operator * (Mat a,Mat b) 9 { 10 Mat c; 11 memset(c.mat,0,sizeof(c.mat)); 12 int i,j,k; 13 for(k =0 ; k < n ; k++) 14 { 15 for(i = 0 ; i < n ;i++) 16 { 17 if(a.mat[i][k]==0) continue;//优化 18 for(j = 0 ;j < n ;j++) 19 { 20 if(b.mat[k][j]==0) continue;//优化 21 c.mat[i][j] = (c.mat[i][j]+(a.mat[i][k]*b.mat[k][j])%mod)%mod; 22 } 23 } 24 } 25 return c; 26 } 27 Mat operator ^(Mat a,int k) 28 { 29 Mat c; 30 int i,j; 31 for(i =0 ; i < n ;i++) 32 for(j = 0; j < n ;j++) 33 c.mat[i][j] = (i==j); 34 for(; k ;k >>= 1) 35 { 36 if(k&1) c = c*a; 37 a = a*a; 38 } 39 return c; 40 }