多项式全家桶学习笔记(进阶)

好的继续一点一点啃吧

Todo List
  • “鸽了”的实现
  • 多项式复合
  • 多项式复合逆
  • 常系数非齐次线性递推

一.数学前置

1.1 二项式反演

\[f(n)=\sum_{i=0}^{n}(-1)^i\binom{n}{i}g(i) \]

等价于

\[g(n)=\sum_{i=0}^{n}(-1)^{n-i}\binom{n}{i}f(i) \]

Proof

证明:参考

显然只要证明前推后即可。

考虑二式的右边。

\[\begin{aligned} \sum_{i=0}^{n}(-1)^{n-i}\binom{n}{i}f(i)&=\sum_{i=0}^{n}(-1)^{n-i}\binom{n}{i}\sum_{j=0}^{i}\binom{i}{j}g(j)\\&=\sum_{i=0}^{n}\sum_{j=0}^{i}(-1)^{n-i}\binom{n}{i}\binom{i}{j}g(j)\\&=\sum_{j=0}^{n}\sum_{i=j}^{n}(-1)^{n-i}\binom{n}{i}\binom{i}{j}g(j)\\&=\sum_{j=0}^{n}\sum_{i=j}^{n}(-1)^{n-i}\binom{n}{j}\binom{n-j}{i-j}g(j)\\&=\sum_{j=0}^{n}\binom{n}{j}g(j)\sum_{i=j}^{n}(-1)^{n-i}\binom{n-j}{i-j}\\&=\sum_{j=0}^{n}\binom{n}{j}g(j)[j=n]\\&=g(j) \end{aligned} \]

得证。

1.2 拉格朗日反演

\[G(F(x))=x \]

\[[x^n]F(x)=\frac{1}{n}[x^{-1}](\frac{1}{G(x)})^n \]

Proof

证明:

看不懂神仙 EI 的做法,只能看别人的做法了.jpg

\[F(x)=\sum_{i}a_ix^i \]

所以

\[\begin{aligned} \sum_{i}a_iG^i(x)&=x\\ \sum_{i}a_iiG^{i-1}(x)G'(x)&=1\\ \sum_{i}a_iiG^{i-n-1}G'(x)&=\frac{1}{G^n(x)}\\ [x^{-1}]\sum_{i}a_iiG^{i-n-1}G'(x)&=[x^{-1}]\frac{1}{G^n(x)} \end{aligned} \]

而当\(i\neq n\)时,显然对左式没有贡献,可得

\[[x^{-1}]a_nnG^{-1}G'(x)=[x^{-1}]\frac{1}{G^n(x)} \]

注意到

\[\begin{aligned} [x^{-1}]G^{-1}(x)G'(x)&=[x^{-1}]\frac{a_1+2a_2x+3a_3x^2+\cdots}{a_1x+a_2x^2+\cdots}\\&=[x^{-1}](\frac{a_1+2a_2x+3a_3x^2+\cdots}{a_1x}\times \frac{1}{1+\frac{a_2}{a_1}x+\frac{a_3}{a_1}x^2+\cdots})\\&=1 \end{aligned} \]

所以

\[a_nn=[x^{-1}]\frac{1}{G^n(x)} \]

\[[x^n]F(x)=a_n=\frac{1}{n}[x^{-1}]\frac{1}{G^n(x)} \]

证毕。

1.3 单位根反演

\(\omega\) 表示 \(n\) 次本原单位根。

我们有

\[[n|k]=\frac{1}{n}\sum_{i=0}^{n-1}\omega^{ik} \]

Proof

证明:

\(n|k\) 时,有 \(\omega^{ik}=1\),显然成立!

\(n\nmid k\) 时,有

\[\sum_{i=0}^{n-1}\omega^{ik}=\frac{1-\omega^{nk}}{1-\omega^k}=0 \]

得证!

1.4 斯特林数

先给出斯特林数的定义:

第一类斯特林数\(\begin{bmatrix}n\\k\end{bmatrix}\) 表示将 \(n\) 个两两不同的元素,划分为 \(k\) 个非空圆排列的方案数。

第二类斯特林数\(\begin{Bmatrix}n\\k\end{Bmatrix}\) 表示将 \(n\) 个两两不同的元素,划分为 \(k\) 个非空子集的方案数。

有如下递推式:

\[\begin{bmatrix}n\\k\end{bmatrix}=\begin{bmatrix}n-1\\k-1\end{bmatrix}+(n-1)\begin{bmatrix}n-1\\k\end{bmatrix} \]

\[\begin{Bmatrix}n\\k\end{Bmatrix}=\begin{Bmatrix}n-1\\k-1\end{Bmatrix}+k\begin{Bmatrix}n-1\\k\end{Bmatrix} \]

有用的式子:

\[n^m=\sum_{k=0}^{m}\begin{Bmatrix}m\\k\end{Bmatrix}\binom{n}{k}k!=\sum_{k=0}^{m}\begin{Bmatrix}m\\k\end{Bmatrix}n^\underline{k} \]

\[x^\overline{k}=\sum_{k=0}^{n}\begin{bmatrix}n\\k\end{bmatrix}x^k \]

斯特林反演:

\[f(n)=\sum_{k=0}^{n}\begin{Bmatrix}n\\k\end{Bmatrix}g(k) \]

等价于

\[g(n)=\sum_{k=0}^{n}(-1)^{n-k}\begin{bmatrix}n\\k\end{bmatrix}f(k) \]

通项公式:

\[\begin{Bmatrix}n\\k\end{Bmatrix}=\sum_{i=0}^{k}\frac{i^n(-1)^{k-i}}{i!(k-i)!} \]

这个可以用二项式反演或者直接组合意义容斥来证

二.进阶多项式算法

2.1 Bluestein's Algorithm

orz myy!

注:原论文似乎有点问题,如果发现这里也有问题欢迎指出。

模板

\(\text{Bluestein's Algorithm}\) 支持任意长度 \(\text{CZT}\),即给出多项式 \(B(x)\),计算

\[a_i=B(c^i)=\sum_{k=0}^{n-1}c^{mk}b_k \]

考虑如何将其化为普通卷积的形式。

下面我们用一种膜法,注意到这么一个恒等式:

\[mk=\frac{-(m-k)^2+m^2+k^2}{2} \]

正确性显然。

通常称为 \(\text{Bluestein}\) 的第一个拆乘积的方法

代入上面的式子:

\[\begin{aligned}a_m&=\sum_{k=0}^{n-1}c^{mk}b_k\\&=\sum_{k=0}^{n-1}c^{\frac{-(m-k)^2+m^2+k^2}{2}}b_k\\&=c^{\frac{m^2}{2}}\sum_{k=0}^{n-1}c^{-\frac{(m-k)^2}{2}}c^{\frac{k^2}{2}}b_k\end{aligned} \]

发现是个卷积,于是直接 NTT 就好了……

吗?

我们发现指数不是整数,这意味着只有在 \(c\) 有二次剩余的时候才可以,但是通常不存在。

有没有不依赖二次剩余的方法呢?

我们发现了另一个式子:

\[mk=\binom{m+k}{2}-\binom{m}{2}-\binom{k}{2} \]

通常称为 \(\text{Bluestein}\) 的第二个拆乘积的方法

于是

\[\begin{aligned}a_m&=\sum_{k=0}^{n-1}c^{mk}b_k\\&=\sum_{k=0}^{n-1}c^{\binom{m+k}{2}-\binom{m}{2}-\binom{k}{2}}b_k\\&=c^{-\binom{m}{2}}\sum_{k=0}^{n-1}c^{\binom{m+k}{2}}\omega^{-\binom{k}{2}}b_k\end{aligned} \]

这就是一个卷积的形式了,直接 NTT 即可。

复杂度 \(O(n\log n)\)

Code
vec CZT(vec f,int len,int c,int m){
	vec A(len),B(len+m),g(m);
	for(int i=0;i<len;i++)A[i]=1LL*qpow(c,P-1-F(i))*f[i]%P;
	for(int i=0;i<len+m;i++)B[i]=qpow(c,F(i));
	reverse(A.begin(),A.end());
	A=mul(A,B,len*2+m);
	for(int i=0;i<m;i++)g[i]=1LL*qpow(c,P-1-F(i))*A[i+len-1]%P;
	return g;
}

2.2 多项式多点求值

模板

多项式多点求值,即求多项式 \(A(x)\) 在点 \(x_1,x_2,\cdots,x_n\) 上分别取到的值。

Sol 1

常用做法。

构造函数

\[\begin{aligned} P_0(x)&=\prod_{i=1}^{\lfloor\frac{n}{2}\rfloor}(x-x_i)\\ P_1(x)&=\prod_{i=\lfloor\frac{n}{2}\rfloor+1}^{n}(x-x_i) \end{aligned} \]

\(A(x)=P_0(x)D(x)+R(x)\),且 \(\deg R<\deg P_0=\lfloor\frac{n}{2}\rfloor\)

那么对于 \(\forall x\in \{x_1,x_2,\cdots,x_{\lfloor\frac{n}{2}\rfloor}\}\),都有 \(A(x)=R(x)\),于是我们就将一个 \(\deg =n\) ,有 \(n\) 个点的问题,转化为一个 \(\deg <\lfloor\frac{n}{2}\rfloor\) ,有 \(\lfloor\frac{n}{2}\rfloor\) 个点的问题。

另一半点值与上面同理。

因此分治 NTT 即可,注意计算 \(P_0(x)\)\(P_1(x)\) 同样可以用一次分治 NTT 预处理。

设计算的复杂度为 \(T(x)\),则 \(T(x)=2T(\frac{x}{2})+O(n\log n)\),此处 \(O(n\log n)\) 的部分是算 \(D(x),R(x)\) 的复杂度,容易发现预计算复杂度也是 \(T(x)\)

由主定理可得总复杂度为 \(O(n\log^2 n)\)

实际应用时可以通过用暴力秦九韶进行剪枝来优化常数。

Code
inline vec mod(vec f,vec g,int n,int m){
   	f.resize(n),g.resize(m);
   	vec ff(n),gg(n),iv(n),t(n);
    for(int i=0,t=n-1;i<n;i++,t--)ff[i]=f[t];
    for(int i=0,t=m-1;i<m;i++,t--)gg[i]=g[t];
    int len=n-m+1;
    for(int i=len;i<n;i++)ff[i]=gg[i]=0;
    getinv(gg,iv,len);
    ff=mul(ff,iv,len<<1);
    vec q(n);
    for(int i=0,t=len-1;i<len;i++)q[i]=ff[t--];
    for(int i=len;i<n;i++)q[i]=0;
    t=mul(q,g,n<<1);
    vec r(m-1);
    for(int i=0;i<m-1;i++)r[i]=(f[i]-t[i]+P)%P;
    return r;
}
void build(int k,int l,int r,const vec&a){
   	if(l==r){
   		Len[k]=1;
   		p[k].resize(2);
   		p[k][0]=P-a[l];
   		p[k][1]=1;
   		return;
	}
	int mid=l+r>>1;
	build(k<<1,l,mid,a);
	build(k<<1|1,mid+1,r,a);
	Len[k]=Len[k<<1]+Len[k<<1|1];
	p[k]=mul(p[k<<1],p[k<<1|1],Len[k]+1);
	p[k].resize(Len[k]+1);
}
void solve(int k,int l,int r,const vec&a,const vec&A,vec&ans){
	if(Len[k]<=500){
		int m=Len[k]-1;
		for(int i=l;i<=r;i++)
			for(int j=m;j>=0;j--)
				ans[i]=(1LL*ans[i]*a[i]+A[j])%P;
		return;
	}
	if(l==r){ans[l]=A[0];return;}
	int mid=l+r>>1;
	vec R;
	R=mod(A,p[k<<1],Len[k],Len[k<<1]+1);
	solve(k<<1,l,mid,a,R,ans);
	R=mod(A,p[k<<1|1],Len[k],Len[k<<1|1]+1); 
	solve(k<<1|1,mid+1,r,a,R,ans);
}
vec evaluation(vec f,vec a,int n,int m){
	build(1,1,m,a);
	if(n>m){
		f=mod(f,p[1],n,Len[1]+1);
	}
	vec ans(m+1);
	solve(1,1,m,a,f,ans);
	return ans;
}

Sol 2

转置做法。

先简单解释一下 转置原理 的核心思想:

对矩阵 \(\mathbf M\) 和向量 \(\mathbf v\),为了快速计算 \(\mathbf {Mv}\),我们可以先考察怎么计算 \(\mathbf M^\mathsf T\mathbf v\),也就是矩阵的转置。设 \(\mathbf M\) 可以分解为 \(\mathbf M=\mathbf E_1 \mathbf E_2\cdots \mathbf E_k\),那么 \(\mathbf M^\mathsf T=\mathbf E_1^\mathsf T \mathbf E_2^\mathsf T\cdots \mathbf E_k^\mathsf T\)。在这些初等矩阵中,它们的功能可以分为两类:

  1. \(\mathbf {Ev}\) 的效果是让向量 \(\mathbf v\) 的第 \(i\) 位乘上 \(c\),那么其转置效果不变。
  2. \(\mathbf{Ev}\) 的效果是让向量 \(\mathbf v\) 的第 \(i\) 位乘上 \(c\) 然后加到第 \(j\) 位,那么它的转置的效果就是让向量的第 \(j\) 位乘上 \(c\) 然后加到第 \(i\) 位。

接下来我们考虑多点求值的过程,其本质是 VanderMonde 矩阵

\[\mathbf V(x_0,x_1,\dots,x_{n-1})= \begin{bmatrix} 1&x_0&x_0^2&\cdots&x_0^{n-1}\\ 1&x_1&x_1^2&\cdots&x_1^{n-1}\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 1&x_{n-1}&x_{n-1}^2&\cdots&x_{n-1}^{n-1} \end{bmatrix} \]

对应的线性变换 \(\mathbf{V}(x_0,x_1,\dots,x_{n-1})\mathbf v\),其中 \(\mathbf v\) 是系数向量 \(\begin{bmatrix}v_0\\v_1\\\vdots\\v_{n-1}\end{bmatrix}\)

根据转置原理,我们考虑其转置 \(\mathbf{V}^\mathsf T(x_0,x_1,\dots,x_{n-1})\mathbf v\)

\[\mathbf V^\mathsf T(x_0,x_1,\dots,x_{n-1})\mathbf v= \begin{bmatrix} 1&1&1&\cdots&1\\ x_0&x_1&x_2&\cdots&x_{n-1}\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ x_0^{n-1}&x_1^{n-1}&x_2^{n-1}&\cdots&x_{n-1}^{n-1} \end{bmatrix}\mathbf v \]

考虑这个转置所求的是什么。

\(k\) 项是

\[\sum_{i=0}^{n-1}x_i^{k}v_i=[x^k]\sum_{i=0}^{n-1}v_i(x_ix)^k=[x^k]\sum_{i=0}^{n-1}\frac{v_i}{1-x_ix} \]

而为了求这个,我们可以这么做:

  1. 分治,维护左右两部分的 \((u_1,L)\)\((u_2,R)\),也就是答案的分子和分母的部分,然后合并为 \((u_1R+u_2L,LR=P)\)
  2. 答案就是 \(\frac{u}{P}=uP^{-1}\),这里 \(P\) 指的是分母,即 \(\prod_i(1-x_ix)\)

我们只要算出其转置,就可以得到新的多点求值做法。在此之前,我们还要考虑一下多项式乘法 \(\mathbf{MUL}(A)\mathbf v\) 的转置 \(\mathbf {MUL}(A)^\mathsf T\mathbf v\)

对多项式 \(A(x)=\sum_{i}a_ix^i\),在多项式乘法中会把每个 \(v_j\) 乘上 \(a_i\) 然后贡献给 \(i+j\),因此根据转置原理,转置的多项式乘法就是把每个 \(v_{i+j}\) 乘上 \(a_i\) 然后贡献给 \(i\)。可以看到,这就是一个标准的减法卷积。此外,如果原来的变换没有溢出部分,那么转置后的溢出部分我们也要扔掉。

于是,我们就可以得到新的多点求值做法:

  1. 整体分治(其实就是线段树的 build),算出每个线段树节点对应的区间里 \((1-x_ix)\) 的乘积。
  2. 对要求的 \(m-1\) 次多项式,我们对它计算 \(\mathbf{MUL}(P^{-1}\bmod x^m)^\mathsf T\) 并保留前 \(n\) 位。
  3. 从线段树自顶向下递归,令下传的两个向量分别为 \(\mathbf l=\mathbf {MUL}(R)^\mathsf T\mathbf v\)\(\mathbf r=\mathbf{MUL}(L)^\mathsf T\mathbf v\)
  4. 最后得到的叶节点的向量长度均为 \(1\),对应于该处的点值。

新做法不需要多项式取模,而且常数也有显著提升。

Code
vec mulT(vec f,vec g){
	int n=f.size(),m=g.size()-1;
	init(n);
	f.resize(lmt),g.resize(lmt);
	reverse(g.begin()+1,g.end());
	vec ret(lmt);
	NTT(f,lmt,1);NTT(g,lmt,1);
	for(int i=0;i<lmt;i++)ret[i]=1LL*f[i]*g[i]%P;
	NTT(ret,lmt,-1);
	ret.resize(n-m+1);
	return ret;
}
pair<vec,vec> mul2(vec a,vec b1,vec b2){
	int n=a.size(),m1=b1.size()-1,m2=b2.size()-1;
	init(n);
	a.resize(lmt),b1.resize(lmt),b2.resize(lmt);
	reverse(b1.begin()+1,b1.end());
	reverse(b2.begin()+1,b2.end());
	vec ret1(lmt),ret2(lmt);
	NTT(a,lmt,1);NTT(b1,lmt,1);NTT(b2,lmt,1);
	for(int i=0;i<lmt;i++)ret1[i]=1LL*a[i]*b1[i]%P,ret2[i]=1ll*a[i]*b2[i]%P;
	NTT(ret1,lmt,-1);NTT(ret2,lmt,-1);
	ret1.resize(n-m1+1);
	ret2.resize(n-m2+1);
	return make_pair(ret1,ret2);
}
void build(int n){
	lc.assign(n*2,0);
	rc.assign(n*2,0);
	deg.assign(n*2,0);
	p.assign(n*2,{0,0});
	q.assign(n*2,{0,0});
	pos.resize(n);
	int cnt=0;
	function<int(int,int)> dfs=[&](int l,int r){
		if(l==r){
			pos[l]=cnt;
			deg[cnt]=1;
			return cnt++;
		}
		int ret=cnt++,mid=l+r>>1;
		lc[ret]=dfs(l,mid);
		rc[ret]=dfs(mid+1,r);
		deg[ret]=deg[lc[ret]]+deg[rc[ret]];
		return ret;
	};
	dfs(0,n-1);
}
vec eval(vec&f,const vec&x){
	int n=f.size();
	build(n);
	rep(i,0,n-1)q[pos[i]]={1,P-x[i]},deg[pos[i]]=1;
	Rep(i,n*2-2,0)if(lc[i])q[i]=mul(q[lc[i]],q[rc[i]],deg[i]+1);
	f.resize(n<<1);
	vec g;
	int len=q[0].size()+1;
	getinv(q[0],g,len);
	g.resize(len);
	p[0]=mulT(f,g);
	rep(i,0,n*2-1)if(lc[i])tie(p[lc[i]],p[rc[i]])=mul2(p[i],q[rc[i]],q[lc[i]]);
	vec ans(n);
	rep(i,0,n-1)ans[i]=p[pos[i]][0];
	return ans;
}
vec evaluation(vec f,vec x){
	int n=f.size(),m=x.size();
	f.resize(max(n,m));
	x.resize(max(n,m));
	vec ret=eval(f,x);
	ret.resize(m);
	return ret;
}

2.3 多项式快速插值

模板

多项式快速插值,即给定 \(n\) 个点 \((x_i,y_i)\),你需要求出一个多项式 \(f(x)\),使得 \(\deg f<n\)\(\forall i,f(x_i)=y_i\)

首先根据拉格朗日插值公式可得

\[\begin{aligned} f(x)&=\sum_{i=1}^{n}y_i\prod_{i\neq j}\frac{x-x_j}{x_i-x_j}\\ &=\sum_{i=1}^{n}\frac{y_i}{\prod_{i\neq j}(x_i-x_j)}\prod_{i\neq j}(x-x_j) \end{aligned} \]

这时如果你直接模拟那么复杂度是 \(O(n^2)\) 的,我们考虑如何优化。

先考虑系数部分的

\[\prod_{i\neq j}(x_i-x_j) \]

不难发现如果设

\[P(x)=\prod_{i}(x-x_i) \]

那么

\[\prod_{i\neq j}(x_i-x_j)=\lim_{x\to x_i}\frac{P(x)}{x-x_i}=P'(x_i) \]

(最后一步是导数的定义)

那么使用多点求值就可以做到 \(O(n\log^2n)\)

下设 \(\frac{y_i}{P'(x_i)}=v_i\)

考虑和多点求值类似的做法,我们还是构造函数

\[\begin{aligned} P_0(x)&=\prod_{i=1}^{\lfloor\frac{n}{2}\rfloor}(x-x_i)\\ P_1(x)&=\prod_{i=\lfloor\frac{n}{2}\rfloor+1}^{n}(x-x_i) \end{aligned} \]

\[\begin{aligned} f_0(x)&=\sum_{i=1}^{\lfloor\frac{n}{2}\rfloor}v_i\prod_{j\neq i,j\le \lfloor\frac{n}{2}\rfloor}(x-x_j)\\ f_1(x)&=\sum_{i=\lfloor\frac{n}{2}\rfloor+1}^{n}v_i\prod_{j\neq i,j>\lfloor\frac{n}{2}\rfloor}(x-x_j) \end{aligned} \]

那么容易发现

\[f(x)=f_0(x)P_1(x)+f_1(x)P_0(x) \]

分治 NTT 即可。

设这部分复杂度为 \(T(x)\),则 \(T(x)=2T(\frac{x}{2})+O(n\log n)\),此处 \(O(n\log n)\) 的部分是计算 \(f(x)\) 的复杂度。由于 \(P(x)\) 在多点求值时已经算过,所以不需再算。

由主定理可得总复杂度为 \(O(n\log^2 n)\)

讲一些卡常的技巧:注意到在递推的时候大部分都是先 \(n\) 大小 IDFT 再 \(2n\) 大小 DFT,可以考虑直接维护 DFT 结果,可以显著优化常数。

Code

鸽了

2.4 普通多项式转下降幂多项式

给定普通多项式

\[F(x)=\sum_{i=0}^{n-1}a_ix^i \]

求下降幂多项式

\[G(x)=\sum_{i=0}^{n-1}b_ix^\underline i \]

使得 \(F(x)=G(x)\)

首先有

\[x^k=\sum_{i=0}^{k}\begin{Bmatrix}k\\i\end{Bmatrix}x^{\underline i} \]

所以

\[\begin{aligned} F(x)&=\sum_{k=0}^{n-1}a_kx^k\\ &=\sum_{k=0}^{n-1}\sum_{i=0}^{k}a_i\begin{Bmatrix}k\\i\end{Bmatrix}x^{\underline i}\\ &=\sum_{i=0}^{n-1}(\sum_{k=i}^{n-1}a_i\begin{Bmatrix}k\\i\end{Bmatrix})x^{\underline i} \end{aligned} \]

所以

\[\begin{aligned} b_k&=\sum_{i=k}^{n-1}a_i\begin{Bmatrix}i\\k\end{Bmatrix}\\ &=\sum_{i=0}^{n-1}a_i\begin{Bmatrix}i\\k\end{Bmatrix}\\ &=\sum_{i=0}^{n-1}a_i\sum_{t=0}^{k}\frac{t^i(-1)^{k-t}}{t!(k-t)!}\\ &=\sum_{t=0}^{k}\frac{\sum_{i=0}^{n-1}a_it^i}{t!}\frac{(-1)^{k-t}}{(k-t)!}\\ &=\sum_{t=0}^{k}\frac{F(t)}{t!}\frac{(-1)^{k-t}}{(k-t)!} \end{aligned} \]

多点求值预处理 \(F(t)\) ,然后卷积即可。

复杂度 \(O(n\log ^2n)\)

Code

鸽了

2.5 下降幂多项式乘法

给定 \(n\) 次下降幂多项式 \(A(x)\)\(m\) 次下降幂多项式 \(B(x)\),求一个 \(n+m\) 次的下降幂多项式 \(F(x)\),使 \(F(x)=A(x)B(x)\)

对于下降幂多项式 \(F(x)\),考虑它的点值的 EGF

\[F^\#=\sum_{i=0}^{\infty}\frac{F(i)}{i!}x^i \]

\(F(x)=x^\underline c\)

\[\begin{aligned} F^\#&=\sum_{i=0}^{\infty}\frac{i^\underline c}{i!}x^i\\ &=\sum_{i=0}^{\infty}\frac{x^i}{(i-c)!}\\ &=x^c\sum_{i=0}^{\infty}\frac{x^i}{i!}\\ &=e^x\times x^c \end{aligned} \]

\[F(x)=\sum_{i=0}^{\infty}a_ix^\underline i \]

\[\begin{aligned} F^\#(x)&=\sum_{i=0}^{\infty}a_ix^ie^x\\ &=G(x)e^x \end{aligned} \]

其中

\[G(x)=\sum_{i=0}^{\infty}a_ix^i \]

也就是说,\(F^\#\) 就是把 \(F\) 当成普通多项式,乘上 \(e^x\) 的结果。

同理可得其逆运算就是 \(e^{-x}\)

点值 EGF 点乘即可,\(e^x\)\(e^{-x}\) 可以手算。

复杂度 \(O(n\log n)\)

Code
void FDT(vec&A,int len,int tp){
	init(len<<1);
	vec ee(lmt);
	if(A.size()<lmt)A.resize(lmt);
	if(tp==-1)for(int i=0;i<lmt;i++)A[i]=1LL*A[i]*invfac[i]%P;
	for(int i=0;i<len;i++){
		if(tp==-1&&i&1)ee[i]=P-invfac[i];
		else ee[i]=invfac[i];
	}
	for(int i=len;i<lmt;i++)ee[i]=A[i]=0;
	NTT(A,lmt,1);NTT(ee,lmt,1);
	for(int i=0;i<lmt;i++)A[i]=1LL*A[i]*ee[i]%P;
	NTT(A,lmt,-1);
	if(tp==1)for(int i=0;i<lmt;i++)A[i]=1LL*A[i]*fac[i]%P;
	for(int i=0;i<lmt;i++)ee[i]=0;
}
vec mulDown(vec f,vec g,int len){
	FDT(f,len,1);FDT(g,len,1);
	for(int i=0;i<len;i++)f[i]=1LL*f[i]*g[i]%P;
	FDT(f,len,-1);
	return f;
}

2.6 下降幂多项式转普通多项式

给定下降幂多项式

\[F(x)=\sum_{i=0}^{n-1}a_ix^\underline i \]

求普通多项式

\[G(x)=\sum_{i=0}^{n-1}b_ix^i \]

使得 \(F(x)=G(x)\)

根据上题结论,下降幂多项式的点值是与 \(e^x\) 的卷积。

那我们只要求出 \(F(x)\)\(0,1,\dots,n-1\) 的点值,然后用多点求值就可以得到原多项式。

复杂度 \(O(n\log^2 n)\)

2.7 多项式复合

2.8 多项式复合逆

2.9 快速沃尔什变换

给定序列 \(A\)\(B\),求

\[C_i=\sum_{j\oplus k=i}A_j\times B_k \]

其中 \(\oplus\)​ 是位运算

尝试采取和 DFT 相类似的手法,考虑另一个数列变换 \(\operatorname{FWT}(A)\),称之为沃尔什变换。

为了能做到快速进行乘法,我们需要使得

\[\operatorname{FWT}(C)=\operatorname{FWT}(A)\cdot \operatorname{FWT}(B) \]

其中 \(\cdot\) 表示点乘。

下面分与、或、异或三种进行讨论。

2.9.1 或

\[C_i=\sum_{j| k=i}A_j\times B_k \]

显然可得

\[j|i=i,k|i=i\iff (j|k)|i=i \]

构造

\[\operatorname{FWT}(A)_i=\sum_{j|i=i}A_j \]

所以

\[\begin{aligned} \operatorname{FWT}(A)_i\operatorname{FWT}(B)_i&=\sum_{k|i=i}a_j\times \sum_{j|i=i}b_k\\ &=\sum_{j|i=i}\sum_{k|i=i}a_jb_k\\ &=\sum_{(j|k)|i=i}a_jb_k\\ &=\sum_{t|i=i}\sum_{j|k=t}a_jb_k\\ &=\sum_{t|i=i}c_t\\ &=\operatorname{FWT}(C)_i \end{aligned} \]

下面考虑如何快速计算和逆运算。

和 FFT 一样,将 \(a\) 拆成下标最高位为 \(0\) 与下标最高位为 \(1\) 两个序列,分别记为 \(a_0\)\(a_1\)

所以可得

\[\operatorname{FWT}(a)=\operatorname{merge}(\operatorname{FWT}(a_0),\operatorname{FWT}(a_0)+\operatorname{FWT}(a_1)) \]

这里 \(\operatorname{merge}\)​ 表示拼接,\(+\) 表示对应位置相加。

分治就好了。

逆运算:根据上面那个式子我们同样可以得到 \(a=\operatorname{merge}(a_0,a_1-a_0)\),就可以了。​

2.9.2 与

完全同理地,我们定义

\[\operatorname{FWT}(A)_i=\sum_{j\&i=i}A_j \]

推理过程略。

2.9.3 异或

这里我们定义运算 \(\otimes\)​​​,使得 \(x\otimes y=\operatorname{popcount}(x\& y)\bmod 2\)

因此我们有 \((i\otimes j)\oplus(i\otimes k)=i\otimes(j\oplus k)\)

那么定义

\[\operatorname{FWT}(A)_i=\sum_{i\otimes j=0}a_j-\sum_{i\otimes j=1}a_j \]

所以

\[\begin{aligned} \operatorname{FWT}(A)\times \operatorname{FWT}(B)&=(\sum_{i\otimes j=0}a_j-\sum_{i\otimes j=1}a_j)(\sum_{i\otimes j=0}b_j-\sum_{i\otimes j=1}b_j)\\ &=(\sum_{i\otimes j=0}a_j)(\sum_{i\otimes k=0}b_k)-(\sum_{i\otimes j=0}a_j)(\sum_{i\otimes k=1}b_k)-(\sum_{i\otimes j=0}a_j)(\sum_{i\otimes k=1}b_k)+(\sum_{i\otimes j=1}a_j)(\sum_{i\otimes k=1}b_k)\\ &=\sum_{i\otimes(j\oplus k)=0}a_jb_k-\sum_{i\otimes(j\oplus k)=1}a_jb_k\\ &=\operatorname{FWT}(C) \end{aligned} \]

所以

\[\begin{aligned} \operatorname{FWT}(a)&=\operatorname{merge}(\operatorname{FWT}(a_0)+\operatorname{FWT}(a_1),\operatorname{FWT}(a_0)-\operatorname{FWT}(a_1))\\ a&=\operatorname{merge}(\frac{a_0+a_1}{2},\frac{a_0-a_1}{2}) \end{aligned} \]

以上复杂度均为 \(O(n\log n)\)

2.10 常系数齐次线性递推

模板

常系数齐次线性递推,是指给定 \(f[1,2,\dots,k]\)\(a[0,1,\dots,k-1]\),且对 \(\forall m\ge k\),都有

\[a_m=\sum_{i=1}^{k}f_ia_{m-i} \]

\(a_n\) 的值。

先考虑一般是如何处理这个问题的。

考虑矩阵

\[A= \begin{bmatrix} f_1 & f_2 & f_3 & \cdots & f_{k-1} & f_k\\ 1 & 0 & 0 & \cdots & 0 & 0\\ 0 & 1 & 0 & \cdots & 0 & 0\\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots\\ 0 & 0 & 0 & \cdots & 1 & 0 \end{bmatrix} \]

那么

\[\begin{bmatrix} a_n\\ a_{n-1}\\ \vdots\\ a_{n-k+1} \end{bmatrix} =A\times \begin{bmatrix} a_{n-1}\\ a_{n-2}\\ \vdots\\ a_{n-k} \end{bmatrix} \]

所以

\[\begin{bmatrix} a_{n}\\ a_{n-1}\\ \vdots\\ a_{n-k+1} \end{bmatrix} =A^{n-k+1}\begin{bmatrix} a_{k-1}\\ a_{k-2}\\ \cdots\\ a_{0} \end{bmatrix} \]

使用矩阵快速幂就可以做到 \(O(k^3\log n)\) 的复杂度。

考虑如何优化这个过程,由于我们只要求 \(a_n\),所以我们只关心右式的第一项即可。

下记 \(m=n-k+1\),且

\[S=\begin{bmatrix} a_{k-1}\\ a_{k-2}\\ \cdots\\ a_{0} \end{bmatrix} \]

现在假设我们不知道从哪找来一个数组 \(c\),使得

\[A^m=\sum_{i=0}^{k-1}c_iA^i \]

\[\begin{aligned} a_n&=(A^m\times S)_0\\ &=(\sum_{i=0}^{k-1}c_iA^i\times S)_0\\ &=\sum_{i=0}^{k-1}c_i(A^i\times S)_0\\ &=\sum_{i=0}^{k-1}c_iS_i \end{aligned} \]

下考虑如何构造 \(c\)

考虑构造一个

\[A^n=Q(A)G(A)+R(A) \]

其中 \(Q,G,R\)​ 是一些多项式,且使得 \(\deg R<\deg G\)​​。

\(\deg G=k\)\(G(A)=0\),有:

\[R(A)\sum_{i=0}^{k-1}c_iA^i \]

因此我们如果构造出了 \(G\),就直接求出 \(x^n\bmod G\) 就可以了,使用快速幂即可,复杂度为 \(O(k\log k\log n)\) 的。

因此只要取

\[\sum_{i=0}^{k}g_iA^i=0 \]

就行。

结论:如果递推系数为 \(\{a\}\),那么 \(g_{k-i}=-a_i,g_k=1\)

Proof 先定义特征值:如果 $$ (\lambda I-A)v=0 $$ 那么 $\lambda$ 是 $A$ 的特征值,$v$ 是 $A$ 的特征向量。

再定义特征多项式:

\[G(\lambda)=\det(\lambda I-A) \]

是特征多项式。

根据 Cayley-Hamilton 定理可得,\(G(A)=0\),因此 \(G\) 就是我们要求的。

\[\begin{aligned} G(\lambda)&=\det (\lambda I-A)\\ &=\det \begin{bmatrix} \lambda-a_1&-a_2&-a_3&\dots&-a_{k-2}&-a_{k-1}&-a_k\\ -1&\lambda&0&\dots&0&0&0\\ 0&-1&\lambda&\dots&0&0&0\\ \vdots&\vdots&\vdots&\ddots&\vdots&\vdots&\vdots\\ 0&0&0&\dots&-1&\lambda&0\\ 0&0&0&\dots&0&-1&\lambda \end{bmatrix}\\ &=(\lambda-a_1)A_{1,1}+(-a_2)A_{1,2}+\dots+(-a_k)A_{1,k}\\ &=\lambda^k-a_1\lambda^{k-1}-\dots-a_k \end{aligned} \]

得证。

复杂度 \(O(k\log k\log n)\)

2.11 常系数非齐次线性递推

posted @ 2020-08-03 13:14  happydef  阅读(962)  评论(6编辑  收藏  举报