【洛谷P4191】【CTSC2010】—性能优化(混合基FFT)
具体看这篇博客就差不多了
注意迭代时先预处理一下位置
中间过程手推一下吧
#include<bits/stdc++.h>
using namespace std;
#define ll long long
#define pb push_back
const int RLEN=1<<20|1;
inline char gc(){
static char ibuf[RLEN],*ib,*ob;
(ob==ib)&&(ob=(ib=ibuf)+fread(ibuf,1,RLEN,stdin));
return (ob==ib)?EOF:*ib++;
}
#define gc getchar
inline int read(){
char ch=gc();
int res=0,f=1;
while(!isdigit(ch))f^=ch=='-',ch=gc();
while(isdigit(ch))res=(res+(res<<2)<<1)+(ch^48),ch=gc();
return f?res:-res;
}
const int N=500005;
int n,c,g,mod;
inline int add(int a,int b){
return a+b>=mod?a+b-mod:a+b;
}
inline void Add(int &a,int b){
a=add(a,b);
}
inline int dec(int a,int b){
return a>=b?a-b:a-b+mod;
}
inline void Dec(int &a,int b){
a=dec(a,b);
}
inline int mul(int a,int b){
return 1ll*a*b>=mod?1ll*a*b%mod:a*b;
}
inline void Mul(int &a,int b){
a=mul(a,b);
}
inline int ksm(int a,int b,int res=1){
for(;b;b>>=1,a=mul(a,a))(b&1)?(res=mul(res,a)):0;return res;
}
int pr[N],tot,A[N],B[N],w[N],pos[N];
inline bool check(int x){
for(int i=1;i<=tot;i++)if(ksm(x,n/pr[i])==1)return false;
return true;
}
inline void findG(int phi){
for(int i=2;i<=10;i++){
for(;!(phi%i);pr[++tot]=i,phi/=i);
}
g=2;
while(!check(g))g++;
}
inline int findpos(int i,int plc,int pos,int len){
if(pos==0)return plc;
int a=len/pr[pos],b=i%pr[pos];
return findpos((i-b)/pr[pos],plc+a*b,pos-1,a);
}
inline void dft(int *a,int lim,int kd){
static int f[N];
memcpy(f,a,sizeof(int)*lim);
for(int i=0;i<lim;i++)f[pos[i]]=a[i];
memcpy(a,f,sizeof(int)*lim);
for(int bl=1,pos=1;pos<=tot;bl*=pr[pos],pos++){
int mid=bl*pr[pos],fg=n/mid;
for(int i=0;i<lim;i+=mid)
for(int j=0;j<mid;j+=bl)
for(int k=0;k<bl;k++){
int s=0,p=(k+j)*fg;
for(int t=0;t<pr[pos];t++)
Add(s,mul(w[1ll*p*t%lim],a[i+k+bl*t]));
f[i+j+k]=s;
}
memcpy(a,f,sizeof(int)*lim);
}
if(kd==-1)for(int i=0,inv=ksm(lim,mod-2);i<lim;i++)Mul(a[i],inv);
}
int main(){
n=read(),c=read(),mod=n+1,findG(n),c=(c-1)%n+1;
for(int i=0;i<n;i++)A[i]=read();
for(int i=0;i<n;i++)B[i]=read();
w[0]=1;for(int i=1;i<n;i++)w[i]=mul(w[i-1],g);
for(int i=1;i<n;i++)pos[i]=findpos(i,0,tot,n);
dft(A,n,1),dft(B,n,1);
for(int i=0;i<n;i++)Mul(A[i],ksm(B[i],c));
dft(A,n,-1),reverse(A+1,A+n);
for(int i=0;i<n;i++)cout<<A[i]<<'\n';
}