MTT:任意模数NTT

MTT:任意模数NTT

概述

有时我们用FFT处理的数据很大,而模数可以分解为\(a\cdot 2^k+1\)的形式。次数用FFT精度不够,用NTT又找不到足够大的模数,于是MTT就应运而生了。

MTT没有模数的限制,比NTT更加自由,应用广泛,可以用于任意模数或很大的数。

MTT

MTT是基于NTT的,其思想很简单,就是做多次NTT,每次使用不同的素数,然后使用CRT合并解,在合并的过程中模最终模数,或是对于无模数的情况使用高精度。

做NTT的次数取决于最大可能答案的大小,所用的所有素数之积必须大于答案

实现

此处以取三个素数为例
我们可以做三次NTT,相邻次之间改变素数,但这样常数太大,于是我们常常选择封装(适合于模数不太多的情况)。
我们定义一个结构体node,有三个成员a,b,c,分别代表三个模数下的值,同时,我们定义模数的结构体与之一一对应。

struct node{
	LL a,b,c;
	node(){
		a=b=c=0;
	}
	node(LL x){
		a=b=c=x;
	}
	node(LL x,LL y,LL z){
		a=x;
		b=y;
		c=z;
	}
}MOD=node(167772161,469762049,998244353),BASE=node(3),INV=node(116878283,426037461,929031873);

我们还要定义关于此结构体的运算,其中成员之间互不影响,只和操作对象里对应的成员产生运算

inline node operator+(node x,node y){
	return node(x.a+y.a,x.b+y.b,x.c+y.c);
}
inline node operator-(node x,node y){
	return node(x.a-y.a,x.b-y.b,x.c-y.c);
}
inline node operator*(node x,node y){
	return node(x.a*y.a%MOD.a,x.b*y.b%MOD.b,x.c*y.c%MOD.c);
}
inline node operator%(node x,node y){
	return node(x.a%y.a,x.b%y.b,x.c%y.c);
}
inline node operator/(node x,node y){
	return node(x.a/y.a,x.b/y.b,x.c/y.c);
}
inline node operator-(node x,LL y){
	return node(x.a-y,x.b-y,x.c-y);
}
inline node operator*(node x,LL y){
	return node(x.a*y,x.b*y,x.c*y);
}
inline node operator/(node x,LL y){
	return node(x.a/y,x.b/y,x.c/y);
}
inline node operator%(node x,LL y){
	return node(x.a%y,x.b%y,x.c%y);
}

然后套用NTT的板子,最后用CRT合并。

假设这一位的答案是\(x\),三个模数分别为\(A,B,C\),那么:

\[\begin{aligned}x\equiv x_1\pmod{A} \\ x\equiv x_2\pmod{B} \\ x\equiv x_3\pmod{C}\end{aligned} \]

先把前两个合并:

\[\begin{aligned}x_1+k_1A=x_2+k_2B\\x_1+k_1A\equiv x_2\pmod{B}\\k_1\equiv \frac{x_2-x_1}A\pmod{B}\end{aligned} \]

于是求出了\(k_1\),也就求出了\(x\equiv x_1+k_1A\pmod{AB}\),记\(x_4=x_1+k_1A\)

\[\begin{aligned}x_4+k_4AB=x_3+k_3C\\x_4+k_4AB\equiv x_3\pmod{C}\\k_4\equiv \dfrac{x_3-x_4}{AB}\pmod{C}\end{aligned} \]

因为\(x<ABC\),所以

\[x=x_4+k_4AB \]

LL CRT(node x){
	LL mod1=MOD.a,mod2=MOD.b,mod3=MOD.c,mod_1_2=mod1*mod2;
	LL inv_1=inv(mod1,mod2),inv_2=inv(mod1*mod2%mod3,mod3);
	LL A=x.a,B=x.b,C=x.c;
	LL x4=(B-A+mod2)%mod2*inv_1%mod2*mod1+A;
	return ((C-x4%mod3+mod3)%mod3*inv_2%mod3*(mod_1_2%Last_Mod)+Last_Mod+x4)%Last_Mod;
}

于是我们就能写出完整代码了。

// luogu-judger-enable-o2
#include<bits/stdc++.h>
using namespace std;
typedef long long LL;
const int INF=1e9+7,MAXN=3e6+10/*Min:2^20+10*/;
void exgcd(LL a,LL b,LL &x,LL &y){
	if(!b){
		x=1;
		y=0;
		return;
	}
	exgcd(b,a%b,y,x);
	y-=a/b*x;
}
inline LL inv(LL x,LL p){
	LL a,b;
	exgcd(x,p,a,b);
	return (a%p+p)%p;
}
struct node{
	LL a,b,c;
	node(){
		a=b=c=0;
	}
	node(LL x){
		a=b=c=x;
	}
	node(LL x,LL y,LL z){
		a=x;
		b=y;
		c=z;
	}
}MOD=node(167772161,469762049,998244353),BASE=node(3),INV=node(116878283,426037461,929031873);
inline node operator+(node x,node y){
	return node(x.a+y.a,x.b+y.b,x.c+y.c);
}
inline node operator-(node x,node y){
	return node(x.a-y.a,x.b-y.b,x.c-y.c);
}
inline node operator*(node x,node y){
	return node(x.a*y.a%MOD.a,x.b*y.b%MOD.b,x.c*y.c%MOD.c);
}
inline node operator%(node x,node y){
	return node(x.a%y.a,x.b%y.b,x.c%y.c);
}
inline node operator/(node x,node y){
	return node(x.a/y.a,x.b/y.b,x.c/y.c);
}
inline node operator-(node x,LL y){
	return node(x.a-y,x.b-y,x.c-y);
}
inline node operator*(node x,LL y){
	return node(x.a*y,x.b*y,x.c*y);
}
inline node operator/(node x,LL y){
	return node(x.a/y,x.b/y,x.c/y);
}
inline node operator%(node x,LL y){
	return node(x.a%y,x.b%y,x.c%y);
}
LL Last_Mod;
LL CRT(node x){
	LL mod1=MOD.a,mod2=MOD.b,mod3=MOD.c,mod_1_2=mod1*mod2;
	LL inv_1=inv(mod1,mod2),inv_2=inv(mod1*mod2%mod3,mod3);
	LL A=x.a,B=x.b,C=x.c;
	LL x4=(B-A+mod2)%mod2*inv_1%mod2*mod1+A;
	return ((C-x4%mod3+mod3)%mod3*inv_2%mod3*(mod_1_2%Last_Mod)+Last_Mod+x4)%Last_Mod;
}
inline LL fpm_(LL base,LL p,LL mod){
	LL ret=1;
	while(p){
		if(p&1)
			ret=ret*base%mod;
		base=base*base%mod;
		p>>=1;
	}
	return ret%mod;
}
inline node fpm(LL base,node p){
	return node(fpm_(base,p.a,MOD.a),fpm_(base,p.b,MOD.b),fpm_(base,p.c,MOD.c));
}
int N,M,lim=1,lg,rev[MAXN];
node Wn[MAXN];
inline void NTT(node *a,int type){
	for(int i=0;i<lim;i++)
		if(i<rev[i])
			swap(a[i],a[rev[i]]);
	for(int mid=1;mid<lim;mid<<=1){
		int len=mid<<1/*n*/;
		node Wn=fpm(3,(MOD-1)/(LL)len);
		for(int j=0;j<lim;j+=len){
			node w=node(1);
			for(int k=0;k<mid;k++){
				node x=a[j+k],y=w*a[j+k+mid]%MOD;
				a[j+k]=(x+y)%MOD;
				a[j+k+mid]=(x-y+MOD)%MOD;
				w=w*Wn%MOD;
			}
		}
	}
	if(type==-1){
		reverse(a+1,a+lim);
		node lim_inv=node(inv(lim,MOD.a),inv(lim,MOD.b),inv(lim,MOD.c)); 
		for(int i=0;i<lim;i++)
			a[i]=a[i]*lim_inv;
	}
}
node a[MAXN],b[MAXN];
int main(){
	scanf("%d%d%lld",&N,&M,&Last_Mod);
	for(int i=0;i<=N;i++){
		LL ii;
		scanf("%lld",&ii);
		a[i]=node(ii%Last_Mod)%MOD;
	}
	for(int i=0;i<=M;i++){
		LL ii;
		scanf("%lld",&ii);
		b[i]=node(ii%Last_Mod)%MOD;
	}
	while(lim<=N+M){
		lim<<=1;
		lg++;
	}
	for(int i=0;i<lim;i++)
		rev[i]=(rev[i>>1]>>1)|((i&1)<<(lg-1));
	Wn[0]=node(1);
	for(int i=1;i<lim;i++)
		Wn[i]=Wn[i-1]*INV;
	NTT(a,1);
	NTT(b,1);
	for(int i=0;i<lim;i++)
		a[i]=a[i]*b[i]%MOD;
	NTT(a,-1);
	for(int i=0;i<=N+M;i++)
		printf("%lld ",CRT(a[i]));
	return 0;
}

例题

模板题:P4245 【模板】任意模数NTT
模板题:【模板】多项式求逆(加强版)
posted @ 2019-08-03 20:19  guoshaoyang  阅读(924)  评论(0编辑  收藏  举报