Cayley-Hamilton定理与矩阵快速幂优化、常系数齐次线性递推优化

原文链接www.cnblogs.com/zhouzhendong/p/Cayley-Hamilton.html

Cayley-Hamilton定理与矩阵快速幂优化、常系数齐次线性递推优化

引入

在开始本文之前,我们先用一个例题作为引入。

  • 给定一个 \(n \times n\) 的矩阵 \(M\) , 求 \(M ^ k\)
  • \(n\leq 50, k\leq 10 ^ {50000}\)

注意到 \(n\) 十分小,但是 $ \log k$ 非常大。如果使用传统的矩阵快速幂,时间复杂度为 \(O(n ^ 3 \log k )\) ,难以接受。

但是运用 Cayley-Hamilton定理 来优化矩阵快速幂,可以做到 \(O(n ^ 4+n^2\log k)\) 甚至更优秀的复杂度\(^1\)

  1. cly 说他看到有人说可以优化到 \(O(n^3 + n^2 \log k)\) 。但是不知道怎么优化。

Cayley-Hamilton定理

\(M\) 为一个 \(n\) 阶矩阵,定义矩阵 \(M\)特征多项式

\[f(x) = |xE-M| = x ^ n + c_1x^{n-1} + c_2 x ^{n-2} + \cdots + c_{n-1}x + c_n \]

其中 \(x\) 可以属于一些域,包括但不限于复数域。

由于 \(|ME - M| = |0| = 0\) ,所以

\[f(M) = M ^ n + c_1 M ^ {n-1} + c_2 M ^ {n-2} + \cdots + c_{n-1} M + c_n = 0 \]

矩阵快速幂

如果我们得到了 \(f(M)\) ,那么,将任意一个矩阵减去任意倍数的 \(f(M)\) 后值不变。

即:令 \(g(x) = x^k\)

\[M ^ k = (g \bmod f)(M) \]

考虑如何求解 \(g \bmod f\)

类比对整数域下取模的快速幂做法,考虑对多项式 \(x\) 做快速幂,对 \(f\) 取模,直接实现的时间复杂度为 \(O(n ^ 2 \log k)\),如果采用 \(FFT\) 优化乘法,并利用多项式取模的做法实现取模,那么时间复杂度为 \(O(n \log n \log k)\)

接下来我们来讨论如何求 \(f(M)\)

\(n\) 个值代入 \(x\) 求行列式,再插值得到 \(f(M)\) ,时间复杂度 $O(n ^ 4) $ ,注意这里要求代入的值存在乘法逆元。

得到 \(g \bmod f\) 之后只需要将所有 \(M\) 的幂代入即可得到 $M ^ k $,这里时间复杂度也是 $O(n ^ 4) $ 。

综上所述,总时间复杂度 \(O(n ^ 4)\)

线性递推

回归本源,当我们要做矩阵快速幂的原因,往往是为了快速实现线性递推。由于线性递推问题存在特殊性,我们可以通过 Cayley-Hamilton定理 来得到更优秀的做法。

假设线性递推数列满足

\[b_n = \sum_{i = 1} ^ k b_{n-k} a _i \]

我们将线性递推的矩阵写出来:

\[\begin {eqnarray*} f(x) &=& |xE - M| \\ &=& \left | \begin {bmatrix} x & -1 & 0 & 0 & \cdots & 0 \\ 0 & x & -1 & 0 & \cdots & 0 \\ 0 & 0 & x & -1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & 0 & \cdots & -1 \\ -a_k & -a_{k-1} & -a_{k-2} & -a_{k-3} &\cdots & x-a_1 \end{bmatrix} \right |\\ & = & x\left | \begin {bmatrix} x & -1 & 0 & 0 & \cdots & 0 \\ 0 & x & -1 & 0 & \cdots & 0 \\ 0 & 0 & x & -1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & 0 & \cdots & -1 \\ -\frac{a_k}{x}-a_{k-1} & -a_{k-2} & -a_{k-3} & a_{k-4} &\cdots & x-a_1 \end{bmatrix} \right |\\ & = & x^2\left | \begin {bmatrix} x & -1 & 0 & 0 & \cdots & 0 \\ 0 & x & -1 & 0 & \cdots & 0 \\ 0 & 0 & x & -1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & 0 & \cdots & -1 \\ -\frac{a_k}{x^2}-\frac{a_{k-1}}x-a_{k-2} & -a_{k-3} & a_{k-4} & a_{k-5}&\cdots & x-a_1 \end{bmatrix} \right |\\ &\Large\vdots &\\ & = & x ^ {k-1} \cdot\left (x - \sum_{i=1}^k \frac {a_i }{x^{i-1}}\right)\\ & = & x ^ k - \sum_{i=1}^{k} a _ i x ^ {k-i} \end {eqnarray*} \]

假设初始向量是列向量 \(B\) ,矩阵是 \(M\) ,那么

\[M = \begin{bmatrix} 0 & 1 & 0 & 0 & \cdots & 0 \\ 0 & 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & 0 & \cdots & 1 \\ a_k & a_{k-1} & a_{k-2} & a_{k-3} &\cdots & a_1 \end{bmatrix} \]

则我们要求的是

\[(B \cdot M^{n} )[0] \]

接下来我们来求 \(M\) 的特征多项式。

于是我们就直接得到了特征多项式的系数。

于是

\[(B \cdot M^{n} )[0]\\ = (B\cdot (x^n \bmod f(x))(M))[0] \]

假设结果为

\[B \cdot \sum_{i=0}^{k-1}c_iM ^ i \\ = \sum_{i = 0}^ {k-1} c_i B M ^ i \]

因为 \(B M ^ i [a] = B[a + i]\),而这里 \(i < k\),我们要求的是 \(BM^i[0]\) ,所以我们只需要知道 \(B[0] \cdots B[k-1]\) 即可。类似地,只要我们预处理 B 数列的前 \(2k\) 项,就可以得到整个 \(BM^i\) 列向量了。

求单个值的时间复杂度为 \(O(k ^ 2\log n)\)

模板题 BZOJ4161

代码

#include <bits/stdc++.h>
#define clr(x) memset(x,0,sizeof x)
#define For(i,a,b) for (int i=a;i<=b;i++)
#define Fod(i,b,a) for (int i=b;i>=a;i--)
#define fi first
#define se second
#define pb(x) push_back(x)
#define mp(x,y) make_pair(x,y)
#define outval(x) printf(#x" = %d\n",x)
#define outtag(x) puts("---------------"#x"---------------")
#define outarr(a,L,R) printf(#a"[%d..%d] = ",L,R);\
						For(_x,L,R)printf("%d ",a[_x]);puts("")
using namespace std;
typedef long long LL;
LL read(){
	LL x=0,f=0;
	char ch=getchar();
	while (!isdigit(ch))
		f|=ch=='-',ch=getchar();
	while (isdigit(ch))
		x=(x<<1)+(x<<3)+(ch^48),ch=getchar();
	return f?-x:x;
}
const int N=2005*2,mod=1e9+7;
int n,k;
int a[N],b[N];
void Add(int &x,int y){
	if ((x+=y)>=mod)
		x-=mod;
}
void Del(int &x,int y){
	if ((x-=y)<0)
		x+=mod;
}
int c[N];
void Mul(int *x,int *y){
	static int z[N];
	clr(z);
	For(i,0,k-1)
		For(j,0,k-1)
			Add(z[i+j],(LL)x[i]*y[j]%mod);
	Fod(i,2*k-2,k){
		if (!z[i])
			continue;
		For(j,1,k)
			Add(z[i-j],(LL)a[j]*z[i]%mod);
	}
	For(i,0,k-1)
		x[i]=z[i];
}
void GetPoly(){
	static int x[N];
	int y=n;
	clr(x),clr(c),c[0]=x[1]=1;
	for (;y;y>>=1,Mul(x,x))
		if (y&1)
			Mul(c,x);
}
int main(){
	n=read(),k=read();
	For(i,1,k)
		a[i]=(read()+mod)%mod;
	For(i,0,k-1)
		b[i]=(read()+mod)%mod;
	GetPoly();
	int ans=0;
	For(i,0,k-1)
		Add(ans,(LL)b[i]*c[i]%mod);
	cout<<ans<<endl;
	return 0;
}
posted @ 2019-05-22 22:05  zzd233  阅读(1104)  评论(0编辑  收藏  举报