NTT简单总结

NTT简单总结

NTT是一个玄学的东西,它通过数论达到和FFT一样的效果(甚至还要快得多)。

NTT的原理其实是将FFT的$w^{k}_{n}$通过另外一个东西代替,从而将FFT中极其之慢的(而且精度爆炸的)浮点数运算更改为整数运算。

在讲NTT之前,先来了解一下数学方面的内容。

数学部分

若$(a,p)$=1,且$p>1$,对于$a^{n}\equiv1(mod p)$最小的$n$称为$a$模$p$的阶,记为$\delta_{p}(a)$

原根

设正整数$p$,整数$a$,若$\delta_{p}(a)=\phi(p)$则称$a$是模$p$的一个原根

原根有一些有趣的性质,而且跟我们在FFT中用到的单位根用到的性质一样!别问我怎么证

为了避免吐槽,还是放个大佬证明

好的,我们终于将浮点数运算转换到了整数域运算。

所以我们直接将FFT代码中的单位根全部换成原根就阔以了。

(不会FFT的请左转百度或右转我的博客

 代码部分

话说这种算法都应该背模板

#include<iostream>
#include<cmath>
using namespace std;
typedef long long ll;
const int N=1e7+5,P=998244353,P1=3,P2=332748118;
int lena,lenb,n=1,lim,r[N];
ll a[N],b[N];
ll rpow(ll x,ll y){//要手打
	ll res=1;
	while(y){
		if(y&1)res=(res*x)%P;
		x=(x*x)%P;
		y>>=1;
	}
	return res%P;
}
inline int read(){
    int x=0,f=1;
    char ch=getchar();
    while(ch<'0'||ch>'9'){
        if(ch=='-')f=-1;
        ch=getchar();
    }
    while(ch>='0'&&ch<='9'){
        x=x*10+ch-'0';
        ch=getchar();
    }
    return x*f;
}
void NTT(ll *A,int tp){
    for(int i=0;i<n;i++)if(i<r[i])swap(A[i],A[r[i]]);
    for(int i=1;i<n;i<<=1){
        ll W=rpow(tp?P1:P2,(P-1)/(i<<1));//替换成原根
        for(int j=i<<1,k=0;k<n;k+=j){
            ll w=1;
            for(int l=0;l<i;l++,w=(w*W)%P){//注意模数
                int x=A[k+l],y=w*A[k+i+l]%P;
                A[k+l]=(x+y)%P;
                A[k+i+l]=(x-y+P)%P;
            }
        }
    }
}
int main(){
    lena=read();lenb=read();
    while(n<=lena+lenb)n<<=1,lim++;
    for(int i=0;i<=lena;i++)a[i]=(read()+P)%P;
    for(int i=0;i<=lenb;i++)b[i]=(read()+P)%P;
    for(int i=0;i<n;i++)r[i]=(r[i>>1]>>1)|((i&1)<<(lim-1));
    NTT(a,1);
    NTT(b,1);
    for(int i=0;i<=n;i++)a[i]=(a[i]*b[i])%P;
    NTT(a,0);
    ll inv=rpow(n,P-2);
    for(int i=0;i<=lena+lenb;i++)printf("%d ",(a[i]*inv)%P);
} 

  

实测洛谷P3803用FFT 3.14s,NTT 1.76s(不吸氧)

(上为NTT,下为FFT)

posted @ 2019-08-26 16:28  Evan704  阅读(526)  评论(0编辑  收藏  举报