【模板】多项式指数函数(多项式 exp)

IV.【模板】多项式指数函数(多项式 exp)

本题有两种解法,一种比较好理解,一种比较通用(并且速度快)。

首先法一便是分治FFT解法。

我们有

B=eA

于是两边求导,得到

B=AeA

因为又有B=eA,代入得

B=AB

我们再积分回去,得到

B=AB

也即

B=AB

我们设AB=T,于是

B=T

所以

Bi=Ti1i

我们回到公式AB=T,将其展开得到

Ti=j=0iBjAij

于是

Bi=j=0i1BjAij1i

为同分治NTT的形式统一,我们设一个Ci=Ai1=iAi

于是

Bi=j=0i1BjCiji

很明显有C0=0,因此我们仍然可以写成

Bi=j=0iBjCiji

注意到一定有B0=1,这可以从式子中直接得出。

然后就是分治NTT的模板题了。只需要记得当分治区间大小为1时,将其所代表的数除以i即可。

时间复杂度O(nlog2n)

代码:

#include<bits/stdc++.h>
using namespace std;
const int N=1<<20;
const int mod=998244353;
const int G=3;
int n,f[N],g[N],rev[N],lim,LG,invlim,all;
int ksm(int x,int y){
	int z=1;
	for(;y;y>>=1,x=1ll*x*x%mod)if(y&1)z=1ll*z*x%mod;
	return z;
}
void NTT(int *a,int tp){
	for(int i=0;i<lim;i++)if(rev[i]>i)swap(a[i],a[rev[i]]);
	for(int md=1;md<lim;md<<=1){
		int rt=ksm(G,(mod-1)/(md<<1));
		if(tp==-1)rt=ksm(rt,mod-2);
		for(int stp=(md<<1),pos=0;pos<lim;pos+=stp){
			int w=1;
			for(int i=0;i<md;i++,w=1ll*w*rt%mod){
				int x=a[pos+i],y=(1ll*w*a[pos+md+i])%mod;
				a[pos+i]=(x+y)%mod;
				a[pos+md+i]=(x+mod-y)%mod;
			}
		}
	}
	if(tp==-1)for(int i=0;i<lim;i++)a[i]=1ll*a[i]*invlim%mod;
}
int a[N],b[N];
void func(int l,int k){
	for(int i=0;i<lim;i++)a[i]=b[i]=0;
	for(int i=0;i<(1<<k);i++)a[i]=g[l+i];
	for(int i=0;i<(2<<k);i++)b[i]=f[i];
	lim=(4<<k),LG=k+2,invlim=ksm(lim,mod-2);
	for(int i=0;i<lim;i++)rev[i]=(rev[i>>1]>>1)|((i&1)<<(LG-1));
	NTT(a,1),NTT(b,1);
	for(int i=0;i<lim;i++)a[i]=1ll*a[i]*b[i]%mod;
	NTT(a,-1);
}
void CDQ(int l,int k){
	if(!k){if(l)g[l]=1ll*g[l]*ksm(l,mod-2)%mod;return;}
	CDQ(l,k-1);
	func(l,k-1);
	for(int i=0;i<(1<<(k-1));i++)(g[l+(1<<(k-1))+i]+=a[(1<<(k-1))+i])%=mod;
	CDQ(l+(1<<(k-1)),k-1);
}
int main(){
	scanf("%d",&n);
	for(int i=0;i<n;i++)scanf("%d",&f[i]),f[i]=1ll*f[i]*i%mod;
	g[0]=1;
	while((1<<all)<n)all++;
	CDQ(0,all);
	for(int i=0;i<n;i++)printf("%d ",g[i]);
	return 0;
}

现在我们回到正解。

首先是牛顿迭代法。这玩意是用来求方程G(F(x))0(modxn)的根的,其中G(x)已知,要求出F(x)

如同求逆一般,我们考虑递推。

我们已经求出一个f(x)使得

G(f(x))0(modxn)

现在我们要求出一个F(x)使得

G(F(x))0(modx2n)

我们将G(F(x))f(x)处泰勒展开,就有

G(F(x))i=0G(i)(f(x))(F(x)f(x))ii!(modx2n)

注意到f0(modxn)fn项的系数皆为0,而F(x)f(x)0(modxn)又是显然成立的,所以当它乘了2次以上的幂以后,前2n位都会为0,也即

(F(x)f(x))i(i2)0(modx2n)

所以当你把它带回泰勒展开式后,就会发现保留前2项即可。

于是

G(F(x))i=01G(i)(f(x))(F(x)f(x))ii!(modx2n)

也即

G(F(x))G(f(x))+G(f(x))(F(x)f(x))(modx2n)

注意到依据定义,是有G(F(x))0(modx2n)

所以

G(f(x))+G(f(x))(F(x)f(x))0(modx2n)

两边同除G(f(x)),得到

G(f(x))G(f(x))+F(x)f(x)0(modx2n)

所以移项,我们得到

F(x)f(x)G(f(x))G(f(x))(modx2n)

这就是多项式牛顿迭代公式,它可以由f推至F

我们将它框起来特别展示一下:

F(x)f(x)G(f(x))G(f(x))(modx2n)

我们现在回到本题。

我们有

B(x)eA(x)(modxn)

两边求ln之后,就得到了

lnB(x)A(x)(modxn)

移项,有

lnB(x)A(x)0(modxn)

我们现在设G(B(x))lnB(x)A(x)(modxn)

按照上面的牛顿迭代公式,假设我们已经知道b(x),则有

B(x)b(x)G(b(x))G(b(x))(modx2n)

代入G的定义,我们有(注意到G(b(x))=1b(x)

B(x)b(x)lnb(x)A(x)1bi(modx2n)

变换得

B(x)b(x)(A(x)lnb(x)+1)(modx2n)

这就是多项式exp的递推式。

通过模板化lnf,我们可以实现它。

代码:

#include<bits/stdc++.h>
using namespace std;
const int N=1<<20;
const int mod=998244353;
const int G=3;
int n,rev[N],f[N],g[N],all;
int ksm(int x,int y){
	int rt=1;
	for(;y;x=(1ll*x*x)%mod,y>>=1)if(y&1)rt=(1ll*rt*x)%mod;
	return rt;
}
void NTT(int *a,int tp,int LG){
	int lim=(1<<LG),invlim=ksm(lim,mod-2);
	for(int i=0;i<lim;i++)rev[i]=(rev[i>>1]>>1)|((i&1)<<(LG-1));
	for(int i=0;i<lim;i++)if(i<rev[i])swap(a[i],a[rev[i]]);
	for(int md=1;md<lim;md<<=1){
		int rt=ksm(G,(mod-1)/(md<<1));
		if(tp==-1)rt=ksm(rt,mod-2);
		for(int stp=md<<1,pos=0;pos<lim;pos+=stp){
			int w=1;
			for(int i=0;i<md;i++,w=(1ll*w*rt)%mod){
				int x=a[pos+i],y=(1ll*w*a[pos+md+i])%mod;
				a[pos+i]=(x+y)%mod;
				a[pos+md+i]=(x-y+mod)%mod;
			}
		}
	}
	if(tp==-1)for(int i=0;i<lim;i++)a[i]=(1ll*a[i]*invlim)%mod;
}
int A[N],B[N],C[N],D[N];
void mul(int *a,int *b,int *c,int LG){
	int lim=(1<<LG);
	for(int i=0;i<lim;i++)A[i]=B[i]=0;
	for(int i=0;i<(lim>>1);i++)A[i]=a[i],B[i]=b[i];
	NTT(A,1,LG),NTT(B,1,LG);
	for(int i=0;i<lim;i++)A[i]=1ll*A[i]*B[i]%mod;
	NTT(A,-1,LG);
	for(int i=0;i<lim;i++)c[i]=A[i];
}
void inv(int *a,int *b,int LG){
	b[0]=ksm(a[0],mod-2);
	for(int k=1;k<=LG+1;k++){
		mul(b,a,C,k);
		for(int i=0;i<(1<<k);i++)C[i]=(mod-C[i])%mod;
		(C[0]+=2)%=mod;
		mul(C,b,b,k);
	}
}
void diff(int *a,int *b,int lim){
	for(int i=0;i<lim;i++)b[i]=1ll*a[i+1]*(i+1)%mod;
	b[lim-1]=0;
}
void inte(int *a,int *b,int lim){
	for(int i=lim-1;i;i--)b[i]=1ll*a[i-1]*ksm(i,mod-2)%mod;
	b[0]=0;
}
void ln(int *a,int *b,int LG){
	inv(a,b,LG);
	diff(a,C,1<<LG);
	mul(b,C,b,LG+1);
	inte(b,b,1<<LG);
}
void exp(int *a,int *b,int LG){
	b[0]=1;
	for(int k=1;k<=LG+1;k++){
		ln(b,D,k-1);
		for(int i=0;i<(1<<(k-1));i++)D[i]=(a[i]-D[i]+mod)%mod;
		D[0]=(D[0]+1)%mod;
//		for(int i=0;i<(1<<(k-1));i++)printf("%d ",D[i]);puts("");
		mul(b,D,b,k);
	}
}
int main(){
	scanf("%d",&n);
	for(int i=0;i<n;i++)scanf("%d",&f[i]);
	while((1<<all)<n)all++;
	exp(f,g,all);
	for(int i=0;i<n;i++)printf("%d ",g[i]);puts("");
	return 0;
}

posted @   Troverld  阅读(969)  评论(0编辑  收藏  举报
编辑推荐:
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示