常系数齐次线性递推

本博客部分参考自dtz的博客Troywar的博客

前言:

为什么要来学这个鬼畜的东西呢……因为模拟赛出了一道板题(好吧这实际上就是BZOJ4162):

看到的时候我非常兴奋,这不是一道sb矩阵快速幂题吗?连邻接矩阵都直接给出来了;

结果一看数据范围,算了算$n^3logk=1.25e10$,emmm我咋不知道矩阵快速幂有什么优化方法?

于是我就自闭了,写了50滚粗(然后一个点1008ms一个点1114ms少了20,气傻了)

然后才知道这是个常系数齐次线性递推模板题……

常系数齐次线性递推

0.预备知识:

有一个数列递推式为:

$$S_i=\sum\limits_{j=1}^{k}a_jS_{i-j}$$

这是一个常系数齐次线性递推的形式,经典问题是给出前$k$项,要求数列第$n$项。朴素的矩阵快速幂相信大家都会……但是矩阵快速幂时间复杂度是$O(k^3logn)$的(听说有些神秘方法可以优化到$O(k^{log_27}n)$但是没啥用),当$k$比较大的时候就GG了,因此需要一些优化。

1.特征多项式和Cayley-Hamilton定理

设$A$是一个$n$阶矩阵,且数$\lambda$和非零列向量$x$满足

$$Ax=\lambda x \;(1)$$

则称$\lambda$为矩阵$A$的特征值,$x$为矩阵$A$的特征向量;

稍微变式可以得到

$$(A-\lambda I)x=0$$

其中$I$表示单位矩阵;

此式有非零解当且仅当其行列式

$$|A-\lambda I|=0 \;(2)$$

(1)式可以看成一个关于$\lambda$的一元$n$次方程,称为矩阵$A$的特征方程,(2)式是关于$\lambda$的$n$次多项式,称为矩阵$A$的特征多项式,记为$\phi(\lambda)$;

注意这里的“特征多项式”指的是广义的多项式,未知数不一定是一个数或字母,也可以是向量或者矩阵;

我们称未知量为一个矩阵的多项式为矩阵的多项式(不同于矩阵多项式);

那么对于任意一个矩阵$A$的特征多项式$\phi(\lambda)$,都有

$$\phi(A)=0(Caylay-Hamilton定理)$$

证明:$\phi(A)=|A-AI|=|0|=0$

2.求解常系数齐次线性递推矩阵的特征多项式

沿用上面的定义,设数列$S$的递推矩阵$A$的特征多项式为$\phi(\lambda)$,则:

$$\phi(\lambda)=|A-\lambda I|=\begin{bmatrix}\lambda&0&\cdots&0&0\\ 0&\lambda&\cdots&0&0\\ \cdots&\cdots&\cdots&\cdots&\cdots\\ 0&0&\cdots&\lambda&0\\ 0&0&\cdots&0&\lambda\end{bmatrix}-\begin{bmatrix}0&0&\cdots&0&a_k\\ 1&0&\cdots&0&a_{k-1}\\ 0&1&\cdots&0&a_{k-2}\\ \cdots&\cdots&\cdots&\cdots&\cdots\\ 0&0&\cdots&1&a_1\end{bmatrix}$$

$$=\begin{bmatrix}\lambda&0&\cdots&0&-a_k\\ -1&\lambda&\cdots&0&-a_{k-1}\\ 0&-1&\cdots&0&-a_{k-2}\\ \cdots&\cdots&\cdots&\cdots&\cdots\\ 0&0&\cdots&-1&\lambda-a_1\end{bmatrix}$$

把$\phi(\lambda)$按最后一列$(j=k)$拉普拉斯展开得

$$\phi(\lambda)=\sum\limits_{i=1}^{k}a_{k-i+1}(-1)^{i+k}\phi(\lambda)_{i,k}$$

其中$\phi(\lambda)_{i,k}$表示$(i,k)$的代数余子式;

化简得:

$$\phi(\lambda)=(-1)^k(\lambda^k-\sum\limits_{i=1}^{k}a_i\lambda^{k-i})$$

3.常系数齐次线性递推

回顾最初的问题,我们想快速求出$A^{n-k+1}$,但直接矩阵乘法时间复杂度会无法承受,所以可以考虑从答案出发,用若干个简化的式子来分解$A^n$(这里用$n$代替了$n-k+1$,规模上是等价的);

根据多项式取模的定义,我们有:

$$x^n(\mod \phi(x))=\phi(x)g(x)+r(x) \;(3)$$

其中$g(x),r(x)$为两个多项式;

把(3)式推广到矩阵的多项式,有:

$$A^n(\mod \phi(A))=\phi(A)g(A)+r(A)$$

由于$\phi(A)=0$,$A^n \mod \phi(A)=A^n$,所以:

$$A^n=r(A)$$

由多项式取模的定义知$r(A)$的次数肯定小于$\phi(A)$的次数,即小于$k$,所以可以直接计算;

考虑多项式取模,若$A(x)\mod P(x)=B(x)$,则$A^2(x)\mod P(x)=B^2(x)$;

因此可以用快速幂的方法来计算$A^n \mod \phi(A)$的结果,即$r(x)$的每项系数;

设已求出$r(x)=\sum\limits_{i=0}^{k-1}b_ix^i$,则

$$r(A)=\sum\limits_{i=0}^{k-1}b_iA^i$$

$$A^n=\sum\limits_{i=0}^{k-1}b_iA^i$$

设$T_i$为表示数列中连续$k$项的向量$\begin{bmatrix}S_i&S_{i+1}&\cdots&S_{i+k-1}\end{bmatrix}$(就是矩阵乘法每次乘出来的那个列向量),把$n-k+1$代回去得:

$$A^{n-k+1}T_0=T_0\sum\limits_{i=0}^{k-1}b_iA^i=\sum\limits_{i=0}^{k-1}b_iA^iT_i=\sum\limits_{i=0}^{k-1}b_iT^i$$

答案就是$A^{n-k+1}T_0$的最后一位,即:

$$S_n=\sum\limits_{i=0}^{k-1}b_iS_{i+k}$$

显然$S_k$到$S_{2k-1}$可以暴力计算,利用上式可以直接求出答案。

至此问题终于解决了!(完结撒花)

4.时间复杂度

由于$k$一般不超过2000,所以实现时多项式乘法和取模可以直接暴力,这样子时间复杂度是$O(k^2logn)$的;

如果遇到毒瘤题当然也可以用多项式全家桶,时间复杂度就是$O(klogklogn)$的。

例题

【BZOJ4161】shlw loves matrix I

模板题,就是上面提到的例子

 1 #include<algorithm>
 2 #include<iostream>
 3 #include<cstring>
 4 #include<cstdio>
 5 #include<cmath>
 6 #include<queue>
 7 #define inf 2147483647
 8 #define eps 1e-9
 9 #define mod 1000000007
10 using namespace std;
11 typedef long long ll;
12 typedef double db;
13 int n,k,ans=0,gm[5001],a[5001],h[5001],x[5001],ret[5001];
14 void add(int &x,int y){
15     if(x+y>=mod)x=x+y-mod;
16     else x+=y;
17 }
18 void mul(int *s,int *x,int *y){
19     static int t[5001];
20     for(int i=0;i<=k*2;i++)t[i]=0;
21     //mul
22     for(int i=0;i<k;i++){
23         for(int j=0;j<k;j++){
24             add(t[i+j],(ll)x[i]*y[j]%mod);
25         }
26     }
27     //mod
28     for(int i=k*2-2;i>=k;i--){
29         for(int j=k-1;j>=0;j--){
30             add(t[i+j-k],mod-(ll)t[i]*gm[j]%mod);
31         }
32     }
33     for(int i=0;i<k;i++){
34         s[i]=t[i];
35     }
36 }
37 void getpw(int y){
38     for(;y;y>>=1,mul(x,x,x)){
39         if(y&1)mul(ret,ret,x);
40     }
41 }
42 int main(){
43     scanf("%d%d",&n,&k);
44     n++;
45     for(int i=1;i<=k;i++){
46         scanf("%d",&a[i]);
47         if(a[i]<0)a[i]+=mod;
48         gm[k-i]=mod-a[i];
49     }
50     gm[k]=1;
51     for(int i=1;i<=k;i++){
52         scanf("%d",&h[i]);
53         if(h[i]<0)h[i]+=mod;
54     }
55     if(n<=k){
56         printf("%d\n",h[n]);
57         return 0;
58     }
59     for(int i=k+1;i<=k*2;i++){
60         for(int j=1;j<=k;j++){
61             add(h[i],(ll)a[j]*h[i-j]%mod);
62         }
63     }
64     x[1]=ret[0]=1;
65     getpw(n-k);
66     for(int i=0;i<k;i++){
67         add(ans,(ll)ret[i]*h[i+k]%mod);
68     }
69     printf("%d",ans);
70     return 0;
71 } 

【BZOJ4612】shlw loves matrix II

就是开头的题目,这题的矩阵是任意给出的,因此不能直接求出特征多项式,要带入$k+1$个$\lambda$求值之后用拉格朗日插值插出特征多项式,求出$r(x)$之后再把$A$带进去暴力算就行了,时间复杂度$O(n^4+n^2logk)$

  1 #include<algorithm>
  2 #include<iostream>
  3 #include<cstring>
  4 #include<cstdio>
  5 #include<cmath>
  6 #include<queue>
  7 #define inf 2147483647
  8 #define eps 1e-9
  9 #define mod 1000000007
 10 using namespace std;
 11 typedef long long ll;
 12 typedef double db;
 13 struct lambda{
 14     int id,x;
 15     lambda(){}
 16     lambda(int _id,int _x){
 17         id=_id,x=_x;
 18     }
 19 }p[55];
 20 int n,a[55][55],sq[55][55],tmp[55][55],dt[55][55],x[110],pw[110],t[110],f[55],g[55],ans[55][55];
 21 char s[10001];
 22 int fastpow(int x,int y){
 23     int ret=1;
 24     for(;y;y>>=1,x=(ll)x*x%mod){
 25         if(y&1)ret=(ll)ret*x%mod;
 26     }
 27     return ret;
 28 }
 29 int det(){
 30     int ret=1,nw,tmp;
 31     for(int i=1;i<=n;i++){
 32         nw=i;
 33         for(int j=i;j<=n;j++){
 34             if(dt[j][i]){
 35                 nw=j;
 36                 break;
 37             }
 38         }
 39         if(nw!=i){
 40             for(int j=i;j<=n;j++){
 41                 swap(dt[i][j],dt[nw][j]);
 42             }
 43             ret=-ret;
 44         }
 45         for(int j=i+1;j<=n;j++){
 46             if(dt[j][i]){
 47                 tmp=(ll)dt[j][i]*fastpow(dt[i][i],mod-2)%mod;
 48                 for(int k=i;k<=n;k++){
 49                     dt[j][k]=(dt[j][k]-(ll)dt[i][k]*tmp%mod)%mod;
 50                 }
 51             }
 52         }
 53         ret=(ll)ret*dt[i][i]%mod;
 54     }
 55     return (ret+mod)%mod;
 56 }
 57 void mul(int *s,int *x,int *y){
 58     for(int i=0;i<=n*2;i++)t[i]=0;
 59     for(int i=0;i<n;i++){
 60         for(int j=0;j<n;j++){
 61             //add(t[i+j],(ll)x[i]*y[j]%mod);
 62             t[i+j]=(t[i+j]+(ll)x[i]*y[j]%mod)%mod;
 63         }
 64     }
 65     int mo=fastpow(f[n],mod-2);
 66     for(int i=n*2-2;i>=n;i--){
 67         for(int j=n-1;j>=0;j--){
 68             //add(t[i+j-n],mod-(ll)f[j]*t[i]%mod*mo%mod);
 69             t[i+j-n]=(t[i+j-n]-(ll)f[j]*t[i]%mod*mo%mod)%mod;
 70         }
 71     }
 72     for(int i=0;i<n;i++){
 73         s[i]=t[i];
 74     }
 75 }
 76 int main(){
 77     scanf("%s%d",s,&n);
 78     for(int i=1;i<=n;i++){
 79         for(int j=1;j<=n;j++){
 80             scanf("%d",&a[i][j]);
 81         }
 82     }
 83     for(int i=0;i<=n;i++){
 84         memcpy(dt,a,sizeof(a));
 85         for(int j=1;j<=n;j++)dt[j][j]-=i;
 86         p[i]=lambda(i,det());
 87     }
 88     for(int i=0;i<=n;i++){
 89         for(int j=0;j<=n;j++)g[j]=0;
 90         g[0]=p[i].x;
 91         for(int j=0;j<=n;j++){
 92             if(i!=j){
 93                 g[0]=(ll)g[0]*fastpow(p[j].id-p[i].id,mod-2)%mod;
 94             }
 95         }
 96         for(int j=0;j<=n;j++){
 97             if(i!=j){
 98                 for(int k=n;k;k--){
 99                     g[k]=((ll)g[k]*p[j].id%mod-g[k-1])%mod;
100                 }
101                 g[0]=(ll)g[0]*p[j].id%mod;
102             }
103         }
104         for(int j=0;j<=n;j++){
105             f[j]=(f[j]+g[j])%mod;
106         }
107     }
108     x[1]=pw[0]=1;
109     for(int i=strlen(s)-1;i>=0;i--){
110         if(s[i]=='1')mul(pw,pw,x);
111         mul(x,x,x);
112     }
113     for(int i=1;i<=n;i++){
114         sq[i][i]=1;
115     }
116     for(int i=0;i<n;i++){
117         for(int j=1;j<=n;j++){
118             for(int k=1;k<=n;k++){
119                 //add(ans[j][k],(ll)sq[j][k]*pw[i]%mod);
120                 ans[j][k]=(ans[j][k]+(ll)sq[j][k]*pw[i]%mod)%mod;
121             }
122         }
123         memset(tmp,0,sizeof(tmp));
124         for(int j=1;j<=n;j++){
125             for(int k=1;k<=n;k++){
126                 for(int l=1;l<=n;l++){
127                     //add(tmp[j][k],(ll)sq[j][l]*a[l][k]%mod);
128                     tmp[j][k]=(tmp[j][k]+(ll)sq[j][l]*a[l][k]%mod)%mod;
129                 }
130             }
131         }
132         memcpy(sq,tmp,sizeof(tmp));
133     }
134     for(int i=1;i<=n;i++){
135         for(int j=1;j<=n;j++){
136             printf("%d ",(ans[i][j]%mod+mod)%mod);
137         }
138         puts("");
139     }
140     return 0;
141 }
posted @ 2018-12-08 16:54  DCDCBigBig  阅读(1263)  评论(1编辑  收藏  举报