FFT/NTT初探

做了全家桶然后写了几道入门题。
FFT.ref
NTT.ref

Luogu4238 【模板】多项式求逆

Link
套牛顿迭代完事。有一个细节问题是:这次运算多项式有几项就只赋几项的值,其他位置(次数大于n次的项在\(mod\ {x^n}\)意义下当然为0)一定要设成0(即清空数组),否则会计算错误。

Luogu5205 【模板】多项式开根

Link
开根也是牛顿迭代的问题。运算的时候时刻注意是在\(mod\ {x^n}\)意义下进行的,这决定了多项式取的位数。
tips:两个长度为n(2的次幂)的多项式相乘,本来应该要在长度为2n下运算,如果在长度为n下运算,那么NTT会起到循环卷积的效果,即后面n项的贡献会平移到前n项来。

Luogu4725 【模板】多项式ln

Link
求导秒掉 求导的时候要注意链式法则。求导和积分最高位也是m-1。

Luogu4726 【模板】多项式exp

Link
牛顿迭代。

Luogu5245 【模板】多项式快速幂

Link
\(B(x)=A^k(x)\ \rightarrow B(x)=e^{k*ln(A(x))}\)

[SDOI2015]序列统计

Link
\(f[i*2][c]= {\sum_{a*b\%m\equiv c}} {f[i][a]*f[i][b]}\)。快速幂一个log,每层转移是\(m^2\)的。转移次数不太好优化,考虑优化每层转移速度。有一个很妙的做法是两边求log,(用原根作为log的底数),此时式子就变成:\(f[i*2][c]= {\sum_{log(a)+log(b)\%m\equiv log(c)}} {f[i][a]*f[i][b]}\),一个平凡的卷积,NTT硬套完事儿。另外普通快速幂就行了,不需要用到ln+exp。

[ZJOI2014]力

Link
IDFT求完后除以n,此处n指的是化为2的次幂的那个n!另外是精度问题!!!假设要卷积的两个多项式F和G,F的系数均在[\(10^{-5},10^{-6}\)]之间,而G的系数均在[\(10^5,10^6\)]之间。直接做两遍DFT+一遍IDFT,涉及的精度跨度是\(10^{12}\),没毛病。但是!!如果用三步并两步优化(一遍DFT+一遍IDFT)的话,涉及的精度跨度上限就是平方,也就是\(10^{24}\)的,而double小数点后有效位数是15~16位,GG。像是这道题如果用了三步并两步,那么就可以获得0分的好成绩(烟)。

板子

FFT

注意idft的时候/n,实部和虚部都要除!

#include<bits/stdc++.h>
using namespace std;
#define REP(i,a,b) for(int i=(a),_ed=(b);i<=_ed;++i)
#define DREP(i,a,b) for(int i=(a),_ed=(b);i>=_ed;--i)
typedef long long ll;
inline int read(){
    register int x=0,f=1;register char ch=getchar();
    while(!isdigit(ch)){if(ch=='-')f=0;ch=getchar();}
    while(isdigit(ch)){x=x*10+(ch^'0');ch=getchar();}
    return f?x:-x;
}

const int N=(1<<21)+5;
const double Pi=acos(-1.0);
int n,m,trans[N];
struct cmplx{
    double x,y;
    inline cmplx(double _x=0,double _y=0):x(_x),y(_y){}
    inline cmplx operator+(const cmplx& t){return (cmplx){x+t.x,y+t.y};}
    inline cmplx operator-(const cmplx& t){return (cmplx){x-t.x,y-t.y};}
    inline cmplx operator*(const cmplx& t){return (cmplx){x*t.x-y*t.y,x*t.y+y*t.x};}
    inline void operator/=(const int &t){x/=t,y/=t;}
};
cmplx f[N],g[N],w[N];

void FFT(cmplx* f,int n){
    REP(i,0,n-1)if(i<trans[i])swap(f[i],f[trans[i]]);
    for(int len=2,d=1;len<=n;d=len,len<<=1)
	for(int p=0;p<n;p+=len)
	    for(int i=p;i<p+d;++i){
		cmplx t=f[i+d]*w[d+i-p];
		f[i+d]=f[i]-t;f[i]=f[i]+t;
	    }
}
void times(cmplx* f,cmplx* g,int m1,int m2){
    int n=1;for(;n<m1+m2-1;n<<=1);
    REP(i,0,n-1)trans[i]=(trans[i>>1]>>1)|(i&1?(n>>1):0);
    for(int len=2,d=1;len<=n;d=len,len<<=1){
	cmplx nw=cmplx(1,0),e=cmplx(cos(2*Pi/len),sin(2*Pi/len));
	for(int i=0;i<d;++i,nw=nw*e)w[d+i]=nw;
    }
    FFT(f,n),FFT(g,n);
    REP(i,0,n-1)f[i]=f[i]*g[i];
    FFT(f,n);
    reverse(f+1,f+n);
    REP(i,0,n-1)f[i]/=n;
}

int main(){
    //freopen("in.in","r",stdin);
    n=read()+1,m=read()+1;
    REP(i,0,n-1)f[i].x=read();
    REP(i,0,m-1)g[i].x=read();
    times(f,g,n,m);
    REP(i,0,n+m-1-1)printf("%d ",(int)(f[i].x+0.5));
    puts("");
    return 0;
}

NTT

NTT过程用ull存储的话,因为计算t的时候值域最大可达\(\log(n)*mod*mod\),所以在范围较大时(例如\(len=1<<17\)),要取一次模防止溢出。

#include<bits/stdc++.h>
using namespace std;
#define REP(i,a,b) for(int i=(a),_ed=(b);i<=_ed;++i)
#define DREP(i,a,b) for(int i=(a),_ed=(b);i>=_ed;--i)
typedef long long ll;
typedef unsigned long long ull;
inline int read(){
    register int x=0,f=1;register char ch=getchar();
    while(!isdigit(ch)){if(ch=='-')f=0;ch=getchar();}
    while(isdigit(ch)){x=x*10+(ch^'0');ch=getchar();}
    return f?x:-x;
}

const int N=(1<<18)+5,mod=998244353;
int n,k,f[N];char s[N];
inline int power(int b,int n){int ans=1;for(;n;n>>=1,b=1ll*b*b%mod)if(n&1)ans=1ll*ans*b%mod;return ans;}
inline void inc(int& x,int y){x=x+y<mod?x+y:x+y-mod;}
inline void dec(int& x,int y){x=x-y>=0?x-y:x-y+mod;}

int trans[N],w[N];
void NTT(int* a,int n){
    static ull f[N];
    REP(i,0,n-1)f[i]=a[i];
    REP(i,0,n-1)if(i<trans[i])swap(f[i],f[trans[i]]);
    for(int len=2,d=1;len<=n;d=len,len<<=1){
	for(int p=0;p<n;p+=len)
	    for(int i=p;i<p+d;++i){
		int t=f[i+d]*w[d+i-p]%mod;
		f[i+d]=f[i]+mod-t;f[i]+=t;
	    }
        if(len==1<<17)REP(i,0,n-1)f[i]%=mod;
    }
    REP(i,0,n-1)a[i]=f[i]%mod;
}
void times(int* f,int* a,int m1,int m2,int lim){
    static int g[N];
    int n=1;for(;n<(m1+m2-1);n<<=1);
    REP(i,0,n-1)trans[i]=(trans[i>>1]>>1)|(i&1?(n>>1):0);
    for(int len=2,d=1;len<=n;d=len,len<<=1){
	int e=power(3,(mod-1)/len);
	REP(i,w[d]=1,d-1)w[d+i]=1ll*w[d+i-1]*e%mod;
    }
    REP(i,m1,n-1)f[i]=0;
    REP(i,0,m2-1)g[i]=a[i];REP(i,m2,n-1)g[i]=0;
    NTT(f,n);NTT(g,n);
    REP(i,0,n-1)f[i]=1ll*f[i]*g[i]%mod;
    NTT(f,n);int inv=power(n,mod-2);
    reverse(f+1,f+n);
    REP(i,0,lim-1)f[i]=1ll*f[i]*inv%mod;
    REP(i,lim,n-1)f[i]=0;
}

void inv(int* f,int m){
    static int g[N],p[N];
    int n=1;for(;n<m;n<<=1);
    g[0]=power(f[0],mod-2);
    for(int len=2;len<=n;len<<=1){
	REP(i,0,(len>>1)-1)p[i]=g[i],g[i]=1ll*2*g[i]%mod;
	times(p,p,len>>1,len>>1,len);times(p,f,len,len,len);
	REP(i,0,len-1)inc(g[i],mod-p[i]);
    }
    REP(i,0,m-1)f[i]=g[i];
    REP(i,0,n-1)g[i]=p[i]=0;
}

void drv(int* f,int m){
    REP(i,0,m-2)f[i]=1ll*(i+1)*f[i+1]%mod;
    f[m-1]=0;
}
void itg(int* f,int m){
    DREP(i,m-1,1)f[i]=1ll*power(i,mod-2)*f[i-1]%mod;
    f[0]=0;
}
void ln(int* f,int m){
    static int g[N];
    REP(i,0,m-1)g[i]=f[i];
    inv(f,m);drv(g,m);
    times(f,g,m,m,m);
    itg(f,m);
    REP(i,0,m-1)g[i]=0;
}

void exp(int* f,int m){
    static int g[N],p[N];
    int n=1;for(;n<m;n<<=1);
    g[0]=1;
    for(int len=2;len<=n;len<<=1){
	REP(i,0,(len>>1)-1)p[i]=g[i];
	ln(p,len);REP(i,0,len-1)p[i]=mod-p[i],inc(p[i],f[i]);
	inc(p[0],1);
	times(g,p,len>>1,len,len);
    }
    REP(i,0,m-1)f[i]=g[i];
    REP(i,0,n-1)g[i]=p[i]=0;
}

void spower(int* f,int m,int k){
    ln(f,n);
    REP(i,0,n-1)f[i]=1ll*k*f[i]%mod;
    exp(f,n);
}

void div(int* a,int* b,int m1,int m2,int* r){
    static int f[N],g[N];
    if(m1<m2){
	REP(i,0,m1-1)r[i]=a[i];REP(i,m1,m2-1)r[i]=0;
	return;
    }
    int lim=m1-m2+1;
    REP(i,0,m1-1)f[i]=a[i];REP(i,0,m2-1)g[i]=b[i];
    reverse(f,f+m1),reverse(g,g+m2);
    REP(i,lim,m1-1)f[i]=0;REP(i,lim,m2-1)g[i]=0;
    inv(g,lim);times(f,g,lim,lim,lim);
    reverse(f,f+lim);
    times(f,b,lim,m2,m1);
    REP(i,0,m1-1)r[i]=a[i],dec(r[i],f[i]);
    REP(i,0,m1-1)f[i]=0;REP(i,0,m2-1)g[i]=0;
}

int main(){
    //freopen("in.in","r",stdin);
    n=read();scanf("%s",s);REP(i,0,strlen(s)-1)k=(1ll*k*10+(s[i]^'0'))%mod;
    REP(i,0,n-1)f[i]=read();
    spower(f,n,k);
    REP(i,0,n-1)printf("%d%c",f[i],i==n-1?'\n':' ');
    return 0;
}
posted @ 2019-12-10 19:11  Fruitea  阅读(400)  评论(0编辑  收藏  举报