FFT小结

FFT小结！

零，说在前面

（转载请注明原文地址：http://www.cnblogs.com/LadyLex/p/8335420.html ）

……令人毒瘤的FFT

其实FFT是卷积这个庞大学术课题的一个小应用啦.....

WC的时候听卷积定理真是上天的体验

那么话不多说我们开始FFT的总结.

板子我们就不放了!这个是很基础的,网上也有讲解的很详细的学习资料

大家请善用搜索引擎啦......

一，FFT与NTT的简单例题以及基础思想&技巧

首先要提到的就是反转思想了。

可能有的题目形式并不是卷积，但是我们通过改变枚举顺序，或者反转数组就可以得到卷积的形式

这样的一个典型题目就是bzoj2194了，非常基础的题目……

这里就不推式子了

然后是关于字符串匹配的问题……说一种最简单的做法吧，我们把一个串反过来，然后同种字符设为1，其余的为0，然后做卷积

这样就可以拿到哪些位置匹配了，然后把每种字符都做一遍就可以得出2个字符串有多长是一样的……

的确有的题问这个的……

以及FFT还可以和斯特林数结合起来……斯特林数大概需要掌握的是容斥的求法以及用fft优化的求法,以及一个重要的转化式子

$$n^{k}= \sum _{j=0} ^{k} S(k,j) * j!* C(n,j) $$

除了数本身,它的实际意义也对于推导有帮助.

学习的时候参考了学长Aglove的笔记........https://www.cnblogs.com/joyouth/p/5600541.html

此外,集合计数类问题常用的2个思路是"枚举最后一个集合的大小"或者"枚举集合的个数"

在很多题目中都有应用!

还有一个技巧,是在出现组合数的时候两边同除阶乘,可以转化为多项式求逆的做法

很多需要用CDQ+FFT的题目都可以转化成多项式求逆

比如bzoj3456,bzoj4555这些都可以使用

二，FFT的更多应用

其实我和Cooook写了一个课件的包括了底下大部分东西(其实只有1~8的内容)……啊我好懒啊我不想再打一遍了

如果有想要课件的同学跟我说下啊……我把密码放在评论区……

链接

一，多项式求逆

二，多项式开根

三，多项式除法&取模

四，多项式取$ln$

五，多项式取$exp$

六，多项式快速插值

七，多项式多点求值

八，指数型母函数

九，任意模数FFT

这个我还没有看……现在正在学ing，请等我补坑……

十，与卷积定理的结合

这个在WC2018上听LCA爷爷讲了讲……听傻了……

现在我还是不会的…估计一段时间内我也不太可能会…留坑待填

十一，特征多项式与矩阵

我们把一个矩阵A的特征值定义为满足$Ax=\lambda x$的$\lambda $

然后特征向量就是上面那个x

特征多项式$g(x)$定义为$|A-xI|$,其中I为单位矩阵

那么这个行列式里面应该是带着一堆x的,这也是它是多项式的原因.....

这个多项式的根就是这个矩阵的特征值

那么这玩意有什么用?

一个很重要的定理是叫做凯莱哈密顿定理,内容是$g(A)=0$,0代表0矩阵

至于矩阵怎么带到多项式里面....请把矩阵看成变量

这样的话我们就可以快速进行矩阵快速幂了.下面说下个人的理解

我们可以通过构造把任意矩阵幂次表示为$A^{n}=k(A)*f(A)+l(A)$的形式,其中k为另外某个多项式,$f(x)$为某多项式,$l$为某矩阵

那么当$f(x)$取$g(x)$的时候,$k*f(x)=k*g(A)=0$

这样的话,就有$A^{n}=l$

那么我们先求$x^{n} \mod g(x)$的值,设其为$h(x)$,那么$h(A)=l$,我们就得到了$A^{n}$

然后这东西一个很大的用途就是处理常系数线性递推的问题

设有递推式:

$$f(n)=\sum _{i=1} ^{k} f_{n-i} a_{i}$$

我们先设系数$a$个数为k,需要求$f$的第n项,

这本来是矩阵乘法的活,但是如果矩阵太大的话时间复杂度就爆炸了......

这时候我们先求出上面提到的$h(x)=x^{n-k} \mod g(x)$,然后我们考虑接下来要干什么

假设我们已经知道了要求的递推式的前$2k$项,

那么最后第n项应该是等于一开始的一横条矩阵(设为T)里面的每一项(即$f(k)$到$f(1)$),然后乘$A^{n-k}$矩阵的对应位置

因为我们把矩阵带入了$h(x)$,即$h(A)=A^{n-k}$

那么我们可以分别对$h(x)$的每一项计算它对答案的贡献

那么其实假如我们在统计第j项的时候,枚举到了$f(i)$,那么它如果乘了$A^{j}$对应位置的系数,那么就等价于变成了$f(i+j)$项

然后我们再乘对应的$h(x)$中系数即可更新$f(n-k+i)$的值

暴力进行这个过程,求单个$f(n)$是$O(k)$的,如果求多个(比如最后k个)$f(n)$,我们还可以使用卷积进行优化

最后一个问题,$g(x)$怎么求?我们对于常系数线性递推有一个结论是

$$g(x)=(-1)^{k} * ( x^{k}-\sum _{i=1} ^{k} a_{i} x^{k-i} )$$

其中$a_{i}$代表对应的第i个系数,这个结论的具体证明和$A$矩阵的特殊形态有关,可是我还不会证明.....

先当作结论记下来记下来

我们的红太阳Troywar给出了证明，我丢个链接就跑

三，FFT/NTT好题选讲

后面的题我在不断做不断更新中……

一，UOJ#50 链式反应

这个题我们发现其实就是一个类似于二叉树计数的题目。

首先我们发现那个标号的限制完全没有用……

不难想到一个$O(n^{3})$的dp方程，即枚举两个中子打到的子树大小，然后再看剩下的大小是否符合破坏死光的要求，再乘组合数。这是一个40pts做法。

然后，这个dp出来之后，我们发现儿子的贡献就是一个卷积的形式啊！

然后把合并写成指数型母函数的卷积，这样的复杂度是$O(n^{2}log_{n})$,可以拿到60pts

然后……你会很快的发现，如果我们把死光也看成多项式，那么就是3个卷起来，那么复杂度就成了$O(nlog_{n}^{2})$，用CDQ+FFT可以得到90pts～100pts

那么我个人就是打的这种方法！4s打2e5的CDQ+FFT是没有问题的！

最有意思的就是那个多项式的维护了。由于我们的式子是这样的：

$$F'(x)=C(x)*F^{2}(x)+1$$

所以我们要维护一个平方的多项式，代表表示1～区间中点mid平方的结果

每次我们用平方数组更新f，然后用新计算了mid+1~r，我们就把它更新到原来那个平方里面去

怎么更新？提示：$(x+a)^{2}=x^{2}+2ax+a^{2}$

当然，我们还有一种解微分方程的做法，但是鉴于我的数学水平我并不会23333。

有兴趣的同学可以看Vfk的题解。

给个代码：

 1 #include <cstdio>
 2 #include <cstring>
 3 #include <algorithm>
 4 #include <cstdlib>
 5 using namespace std;
 6 #define N 400010
 7 #define L 1100000
 8 #define mod 998244353
 9 #define phi 998244352
10 #define g 3
11 #define LL long long
12 inline int max(int a,int b){return a>b?a:b;}
13 inline int min(int a,int b){return a<b?a:b;}
14 char s[N];
15 int f[N],pf[N],n,logi[N],litlen=1,len=1;
16 int bin[25],poww[L],rev[L],fac[L],inv[L],invf[L];
17 inline int quick_mod(int di,int mi)
18 {
19     int ret=1;
20     for(;mi;mi>>=1,di=(LL)di*di%mod)
21         if(mi&1)ret=(LL)ret*di%mod;
22     return ret;
23 }
24 inline void upd(int &a,int b){a+=b;if(a>=mod)a-=mod;}
25 inline int sub(int a,int b){a-=b;if(a<0)a+=mod;return a;}
26 inline int dft(int *a,int opt,int le)
27 {
28     register int i,j,d,l,wn,w,tmp;
29     for(i=0;i<le;++i)if(i<rev[i])swap(a[i],a[rev[i]]);
30     for(d=2;d<=le;d<<=1)
31         for(wn=(opt==1)?poww[len/d]:poww[len-len/d],l=d>>1,i=0;i<le;i+=d)
32             for(w=1,j=0;j<l;++j,w=(LL)w*wn%mod)
33                 tmp=(LL)a[i+j+l]*w%mod,a[i+j+l]=(a[i+j]-tmp+mod)%mod,a[i+j]=(a[i+j]+tmp)%mod;
34                 // tmp=(LL)a[i+j+l]*w%mod,a[i+j+l]=sub(a[i+j],tmp),upd(a[i+j],tmp);
35     if(opt==-1)
36         for(i=0;i<le;++i)a[i]=(LL)a[i]*inv[le]%mod;
37 }
38 int ret[L],C[L],A[L],B[L];
39 inline void CDQ(int l,int r)
40 {
41     if(l==r)
42         if(l<n){printf("%d\n",(LL)f[l]*fac[l-1]%mod);return;}
43         else {printf("%d\n",(LL)f[l]*fac[l-1]%mod);exit (0);}
44     register int le=r-l+1,i,mi=(l+r)>>1;
45     CDQ(l,mi);
46     for(i=0;i<le;++i)
47         if(i&1)rev[i]=(rev[i>>1]>>1)|(le>>1);
48         else rev[i]=(rev[i>>1])>>1;
49     memset(A,0,le<<2),memset(B,0,le<<2);
50     for(i=l;i<=mi;++i)A[i-l]=pf[i];
51     for(i=0;i<r-l;++i)B[i]=C[i];
52     dft(A,1,le),dft(B,1,le);
53     for(i=0;i<le;++i)ret[i]=(LL)A[i]*B[i]%mod;
54     dft(ret,-1,le);
55     for(i=mi+1;i<=r;++i)upd(f[i],ret[i-l-1]);
56     memset(A,0,le<<2),memset(B,0,le<<2);
57     for(i=l;i<=mi;++i)A[i-l]=(LL)f[i]*inv[i]%mod;
58     for(i=0;i<=r-l;++i)
59         if(i<l)B[i]=(LL)f[i]*inv[i]*2%mod;
60         else if(i<=mi)B[i]=(LL)f[i]*inv[i]%mod;
61     dft(A,1,le),dft(B,1,le);
62     for(i=0;i<le;++i)ret[i]=(LL)A[i]*B[i]%mod;
63     dft(ret,-1,le);
64     for(i=mi+1;i<=r;++i)upd(pf[i],ret[i-l]);
65     CDQ(mi+1,r);
66 }
67 int main()
68 {
69     register int i,j;
70     for(bin[0]=i=1;i<=20;++i)bin[i]=bin[i-1]<<1;
71     scanf("%d%s",&n,s);
72     while(len<(n<<1))len<<=1;
73     poww[0]=1,poww[1]=quick_mod(g,phi/len);
74     for(i=2;i<=len;++i)poww[i]=(LL)poww[i-1]*poww[1]%mod;
75     for(fac[0]=fac[1]=1,i=2;i<=len;++i)fac[i]=(LL)fac[i-1]*i%mod;
76     for(inv[0]=inv[1]=1,i=2;i<=len;++i)inv[i]=(LL)inv[mod%i]*(mod-mod/i)%mod;
77     for(invf[0]=invf[1]=1,i=2;i<=len;++i)invf[i]=(LL)invf[i-1]*inv[i]%mod;
78     for(i=0;i<n;++i)
79         if(s[i]=='1')C[i]=(LL)invf[i]*inv[2]%mod;
80     f[1]=1,CDQ(1,len>>1);
81 }

UOJ#50

二，UOJ#182 a^-1+b problem

这题我在课件里面讲了！

然后写的自己还算满意吧……再简单说一下

总之你可以发现每个数再若干次操作之后可以写成$\frac {Ax+C}{Bx+D}$的形式，x代表每个数的初始值。然后……你把它写丑一点，可以变成形如$e+f*\frac{1}{x+g}$的形式……但是具体内容请自己推导吧……

那么总和就是$n*e+f*\sum\frac{1}{x+g}$，问题转化为维护$\sum\frac{1}{x_{i}+g}$

如果我们把g看成变量的话

那么这个东西，通分可以得到等价于$\frac{ \sum _{j} \prod _{i!=j} {A_{i}+x} } {\prod _{j} (A_{j}+x)}$

注意到分母里的式子（设为$f$）可以倍增加FFT求出来

分子的式子（设为$g$），经过我们的推导，是$f$的导数

你问我怎么推导？

第一种方法，你可以打表

第二种方法，观察特殊点……我当时只看到了$[x^{n-1}]g(x)=n$

第三种方法，我们推他一下……

啊……我推了半小时推不出来

如果有会的同学请在评论区教教我

然后呢？我们可以套用多项式多点求值的模板，求出两个函数每一个点的点值，然后计算答案就行了

然后这题让我知道了指针的常数很小23333

  1 #include <cstdio>
  2 #include <cstring>
  3 #include <ctime>
  4 #include <algorithm>
  5 using namespace std;
  6 #define mod 998244353
  7 #define LL long long
  8 #define RG register
  9 #define N 100010
 10 #define M 60010
 11 char cB[1<<15],*S=cB,*T=cB;
 12 #define getc (S==T&&(T=(S=cB)+fread(cB,1,1<<15,stdin),S==T)?0:*S++)
 13 inline int read()
 14 {
 15     int x=0;RG char c=getc;
 16     while(c<'0'|c>'9')c=getc;
 17     while(c>='0'&c<='9')x=10*x+(c^48),c=getc;
 18     return x;
 19 }
 20 inline int quick_mod(int di,int mi)
 21 {
 22     int ret=1;
 23     for(;mi;mi>>=1,di=(LL)di*di%mod)
 24         if(mi&1)ret=(LL)ret*di%mod;
 25     return ret;
 26 }
 27 #define L (1<<18)+10
 28 #define LM (1<<16)+10
 29 int logi[L],inv[L],bin[25],rev[L],poww[L],len=1,ro=1;
 30 inline void dft(int *a,int n,int opt)
 31 {
 32     RG int i,j,d=logi[len]-logi[n],wn,l,tmp,*x,*y,*w;
 33     for(i=0;i<n;++i)if(i<(rev[i]>>d))swap(a[i],a[rev[i]>>d]);
 34     for(d=2;d<=n;d<<=1)
 35         for(i=0,l=d>>1,wn=(opt==1)?(len/d):(-len/d);i<n;i+=d)
 36             for(w=poww+((opt==1)?0:len),j=0,x=a+i+j,y=x+l;j<l;++j,w+=wn,++x,++y)
 37                 tmp=(LL)(*w)*(*y)%mod,*y=(*x-tmp+mod)%mod,*x=(*x+tmp)%mod;
 38     if(opt==-1)for(i=0;i<n;++i)a[i]=(LL)a[i]*inv[n]%mod;
 39 }
 40 int n,m,cnt,sum,x[N];
 41 int g[L<<1],h[L<<1];
 42 int sta[LM],ans[M];
 43 struct node{int e,f,g,id;}s[M];
 44 inline void ins(int a,int b,int c,int d,int id)
 45 {
 46     if(b==0)
 47         {ans[id]=(((LL)a*sum)+((LL)c*n))%mod*(LL)quick_mod(d,mod-2)%mod;return;}
 48     s[++cnt].f=((LL)b*c-(LL)a*d)%mod,
 49     b=quick_mod(b,mod-2);
 50     s[cnt].e=(LL)a*b%mod,s[cnt].g=(LL)d*b%mod,
 51     b=(LL)b*b%mod,s[cnt].f=(LL)s[cnt].f*b%mod;
 52     if(s[cnt].f<0)s[cnt].f+=mod;
 53     s[cnt].id=id;
 54 }
 55 inline int solve0(int *a,int l,int r)
 56 {
 57     RG int ra=r-l+2;
 58     if(ra<=128)
 59     {
 60         memset(a,0,ra<<2),a[0]=1;
 61         RG int i,j,v;
 62         for(i=l;i<=r;++i)
 63             for(v=x[i],j=i-l;~j;--j)
 64                 a[j+1]=(a[j+1]+a[j])%mod,
 65                 a[j]=(LL)a[j]*v%mod;
 66         return ra;
 67     }
 68     RG int i,mi=l+r>>1,la=1;
 69     while(la<ra)la<<=1;
 70     RG int *f1=a,r1=solve0(f1,l,mi);
 71     RG int *f2=a+r1,r2=solve0(f2,mi+1,r);
 72     static int tmp1[L],tmp2[L];
 73     memcpy(tmp1,f1,r1<<2),memset(tmp1+r1,0,(la-r1)<<2),dft(tmp1,la,1);
 74     memcpy(tmp2,f2,r2<<2),memset(tmp2+r2,0,(la-r2)<<2),dft(tmp2,la,1);
 75     for(i=0;i<la;++i)a[i]=(LL)tmp1[i]*tmp2[i]%mod;
 76     dft(a,la,-1);
 77     return ra;
 78 }
 79 int *p[L];
 80 inline int solve1(int id,int l,int r)
 81 {
 82     static int mem[LM<<4],*head=mem;
 83     RG int ra=r-l+2;
 84     if(ra<=128)
 85     {
 86         RG int i,j,v,*f=p[id]=head;head+=ra;
 87         memset(f,0,ra<<2),f[0]=1;
 88         for(i=l;i<=r;++i)
 89             for(v=(mod-sta[i])%mod,j=i-l;~j;--j)
 90                 f[j+1]=(f[j+1]+f[j])%mod,f[j]=(LL)f[j]*v%mod;
 91         return ra;
 92     }
 93     RG int mi=l+r>>1,la=1;
 94     while(la<ra)la<<=1;
 95     RG int r1=solve1(id<<1,l,mi),*f1=p[id<<1];
 96     RG int r2=solve1(id<<1|1,mi+1,r),*f2=p[id<<1|1];
 97     static int tmp1[LM],tmp2[LM];
 98     memcpy(tmp1,f1,r1<<2),memset(tmp1+r1,0,(la-r1)<<2),dft(tmp1,la,1);
 99     memcpy(tmp2,f2,r2<<2),memset(tmp2+r2,0,(la-r2)<<2),dft(tmp2,la,1);
100     RG int i,*f=p[id]=head;head+=ra;
101     for(i=0;i<la;++i)f[i]=(LL)tmp1[i]*tmp2[i]%mod;
102     dft(f,la,-1);return ra;
103 }
104 inline int get_inv(int *a,int *ret,int ra)
105 {
106     if(ra==1){ret[0]=quick_mod(a[0],mod-2);return 1;}
107     static int tmp[L];
108     RG int r1=get_inv(a,ret,(ra+1)>>1),i,la=1;
109     while(la<(ra<<1))la<<=1;
110     memcpy(tmp,a,ra<<2),memset(tmp+ra,0,(la-ra)<<2);
111     memset(ret+r1,0,(la-r1)<<2);
112     dft(tmp,la,1),dft(ret,la,1);
113     for(i=0;i<la;++i)
114     {
115         ret[i]=((LL)ret[i]*(2ll-((LL)ret[i]*tmp[i]%mod)))%mod;
116         if(ret[i]<0)ret[i]+=mod;
117     }
118     dft(ret,la,-1);return ra;
119 }
120 inline void rev_copy(int *st,int *to,int ra)
121     {for(RG int i=0;i<ra;++i)to[i]=st[ra-i-1];}
122 inline void reverse(int *st,int ra)
123     {for(RG int t,i=0,j=ra-1;i<j;++i,--j)t=st[i],st[i]=st[j],st[j]=t;}
124 inline int get_mod(int *a,int ra,int *p,int rp,int *ret)
125 {
126     while(ra&&!a[ra-1])--ra;
127     while(rp&&!p[rp-1])--rp;
128     if(ra<rp){memcpy(ret,a,ra<<2),memset(ret+ra,0,(rp-ra)<<2);return rp;}
129     static int tmp1[L],tmp2[L];
130     RG int i,j,re=ra-rp+1,la=1;
131     while(la<(re<<1))la<<=1;
132     memset(tmp1,0,la<<2),rev_copy(p,tmp1,rp),get_inv(tmp1,tmp2,re);
133     memset(tmp2+re,0,(la-re)<<2),dft(tmp2,la,1);
134     rev_copy(a,tmp1,ra),memset(tmp1+re,0,(la-re)<<2),dft(tmp1,la,1);
135     for(i=0;i<la;++i)tmp1[i]=(LL)tmp1[i]*tmp2[i]%mod;
136     dft(tmp1,la,-1);
137     la=1;while(la<ra)la<<=1;
138     reverse(tmp1,re),memset(tmp1+re,0,(la-re)<<2),dft(tmp1,la,1);
139     memcpy(tmp2,p,rp<<2),memset(tmp2+rp,0,(la-rp)<<2),dft(tmp2,la,1);
140     for(i=0;i<la;++i)tmp1[i]=(LL)tmp1[i]*tmp2[i]%mod;
141     dft(tmp1,la,-1);
142     for(i=0;i<rp;++i)ret[i]=(a[i]-tmp1[i]+mod)%mod;
143     memset(ret+rp,0,(la-rp)<<2);
144     while(rp&&!ret[rp-1])--rp;
145     return rp;
146 }
147 int val0[LM],val[LM];
148 inline void solve2(int id,int *a,int *b,int l,int r,int deg)
149 {
150     RG int ra=r-l+2;
151     if(deg<=128)
152     {
153         RG int i,j,v,u,F,G;
154         for(i=l;i<=r;val0[i]=F,val[i]=G,++i)
155             for(u=sta[i],v=1,F=G=0,j=0;j<=deg;++j,v=(LL)v*u%mod)
156                 F=(F+(LL)v*a[j])%mod,G=(G+(LL)v*b[j])%mod;
157         return;
158     }
159     RG int i,mi=l+r>>1;
160     int r1=get_mod(a,deg,p[id],ra,a+deg);a+=deg;
161     int r2=get_mod(b,deg,p[id],ra,b+deg);b+=deg;
162     ra=min(r1,r2);
163     solve2(id<<1,a,b,l,mi,ra),solve2(id<<1|1,a,b,mi+1,r,ra);
164 }
165 int main()
166 {
167     RG int i,j,opt,v,A=1,B=0,C=0,D=1;
168     n=read(),m=read();
169     while(len<(n<<1))len<<=1;
170     for(bin[0]=i=1;i<=20;++i)bin[i]=bin[i-1]<<1;
171     for(i=0;i<=20;++i)
172         inv[bin[i]]=quick_mod(bin[i],mod-2),logi[bin[i]]=i;
173     for(int i=0;i<len;++i)
174         if(i&1)rev[i]=(rev[i>>1]>>1)|(len>>1);
175         else rev[i]=(rev[i>>1]>>1);
176     poww[0]=1,poww[1]=quick_mod(3,(mod-1)/len);
177     for(i=2;i<=len;++i)poww[i]=(LL)poww[i-1]*poww[1]%mod;
178     for(sum=0,i=1;i<=n;++i)x[i]=read(),sum=(sum+x[i])%mod;
179     for(i=1;i<=m;++i)
180         if(read()==1)v=read(),A=(A+(LL)v*B)%mod,C=(C+(LL)v*D)%mod,ins(A,B,C,D,i);
181         else swap(A,B),swap(C,D),ins(A,B,C,D,i);
182     if(cnt)
183     {
184         for(i=1;i<=cnt;++i)sta[i]=s[i].g;
185         sort(sta+1,sta+cnt+1),opt=unique(sta+1,sta+cnt+1)-sta-1;
186         for(i=1;i<=cnt;++i)
187             s[i].g=lower_bound(sta+1,sta+opt+1,s[i].g)-sta;
188         solve0(g,1,n);
189         for(h[n]=0,i=1;i<=n;++i)h[i-1]=(LL)g[i]*i%mod;
190         solve1(1,1,opt),solve2(1,g,h,1,opt,n+1);
191         for(i=1;i<=cnt;++i)
192             ans[s[i].id]=( (LL)s[i].e*n+(LL)s[i].f*val[s[i].g]%mod*quick_mod(val0[s[i].g],mod-2) )%mod;
193     }
194     for(i=1;i<=m;++i)printf("%d\n",ans[i]);
195 }

UOJ#182

三，UOJ#86

myy的题真是太毒辣！

首先我们要知道c++11有一个__int128，可以当一个假高精度用

观察暴力……我们当然可以写一个卢卡斯暴力判断

但是我们看，把卢卡斯的暴力写出来，应该是

$$C(x,n)=C(x\%p,n\%p)*C(x/p,n/p)$$

也就是说可以拆成一堆C的$\prod$

这样它和p进制数位DP很像……那么我们把数转成p进制

定义数组$f[i][j]$是前i位，那一堆C乘起来是j的方案数，然后枚举这一位填什么，计算C乘起来转移

然后我们看，它类似一个假的卷积

我们通过原根使得它变成加法，再用FFT优化，就可以做到$O(plog_{p}^{n}log_{2}^{p})$的复杂度了

其实我觉得最难想的是变成数位DP这个部分……如果想到数位DP后面就没那么难了……

丢代码：

  1 #include <cstdio>
  2 #include <cstring>
  3 #include <algorithm>
  4 using namespace std;
  5 #define LLL __int128
  6 #define LL long long
  7 #define RG register
  8 #define PMAX 30010
  9 #define mod 998244353
 10 inline int quick_mod(int di,int mi)
 11 {
 12     RG int ret=1;
 13     for(;mi;mi>>=1,di=(LL)di*di%mod)
 14         if(mi&1)ret=(LL)ret*di%mod;
 15     return ret;
 16 }
 17 #define L (1<<16)+10
 18 int len=1,rev[L],poww[L];
 19 inline void dft(int *a,int opt)
 20 {
 21     RG int i,j,d,l,*w,wn,tmp,*x,*y;
 22     for(i=0;i<len;++i)if(i<rev[i])swap(a[i],a[rev[i]]);
 23     for(d=2;d<=len;d<<=1)
 24         for(i=0,l=(d>>1),wn=(opt==1?(len/d):(-len/d));i<len;i+=d)
 25             for(j=0,w=(poww+(opt==1?0:len)),x=a+i,y=x+l;j<l;++j,++x,++y,w+=wn)
 26                 tmp=(LL)(*w)*(*y)%mod,*y=(*x+mod-tmp)%mod,*x=(*x+tmp)%mod;
 27     if(opt==-1)
 28         for(tmp=quick_mod(len,mod-2),i=0;i<len;++i)a[i]=(LL)a[i]*tmp%mod;
 29 }
 30 int p,phi,root,logv[PMAX],expg[PMAX];
 31 int fac[PMAX],invf[PMAX];
 32 inline int C(int a,int b)
 33     {return (a<b)?0:(fac[a]*invf[b]%p*invf[a-b]%p);}
 34 inline int quick_p(int di,int mi)
 35 {
 36     RG int ret=1;
 37     for(;mi;mi>>=1,di=di*di%p)
 38         if(mi&1)ret=ret*di%p;
 39     return ret;
 40 }
 41 inline void getroot()
 42 {
 43     RG int i,j,v;
 44     for(i=1;i<p;++i)
 45     {
 46         memset(logv,-1,sizeof(logv));
 47         logv[1]=0,expg[0]=1;
 48         for(v=i,j=1;j<phi;v=v*i%p,++j)
 49             {if(logv[v]>=0)break;expg[j]=v,logv[v]=j;}
 50         if(j==phi){root=i;return;}
 51     }
 52 }
 53 char B[1<<15],*S=B,*T=B;
 54 #define getc (S==T&&(T=(S=B)+fread(B,1,1<<15,stdin),S==T)?0:*S++)
 55 template <typename _T>
 56 inline _T read()
 57 {
 58     RG _T x=0;RG char c=getc;
 59     while(c<'0'|c>'9')c=getc;
 60     while(c>='0'&&c<='9')x=10*x+(c^48),c=getc;
 61     return x;
 62 }
 63 int lenn,bn[300];
 64 int f[300][L],g[300][L];
 65 int ans[PMAX],tmp[L],tmp1[L],tmp2[L];
 66 inline void calc(LLL n,int opt)
 67 {
 68     if(n<=0)return;
 69     RG int i,j,v,k,bin[300],to,bit=0;
 70     memset(bin,0,sizeof(bin));
 71     while(n)bin[++bit]=n%p,n/=p;
 72     RG int lim=max(bit,lenn);
 73     memset(f,0,sizeof(f)),f[0][0]=1;
 74     if(opt==1)
 75     {
 76         memset(g,0,sizeof(g)),g[0][0]=1;
 77         for(i=1;i<=lim;++i)
 78         {
 79             memset(tmp1,0,sizeof(tmp1));
 80             for(j=bn[i];j<p;++j)
 81                 {v=logv[C(j,bn[i])];if(v!=-1)++tmp1[v];}
 82             memcpy(tmp2,g[i-1],phi<<2);
 83             memset(tmp2+phi,0,(len-phi)<<2);
 84             dft(tmp1,1),dft(tmp2,1);
 85             for(j=0;j<len;++j)tmp[j]=(LL)tmp1[j]*tmp2[j]%mod;
 86             dft(tmp,-1);
 87             for(j=0;j<phi;++j)
 88                 g[i][j]=(tmp[j]+tmp[j+phi])%mod;
 89         }
 90     }
 91     for(i=1;i<=lim;++i)
 92     {
 93         memset(tmp1,0,sizeof(tmp1));
 94         for(j=bn[i];j<bin[i];++j)
 95         {
 96             v=logv[C(j,bn[i])];
 97             if(v!=-1)++tmp1[v];
 98         }
 99         memcpy(tmp2,g[i-1],phi<<2);
100         memset(tmp2+phi,0,(len-phi)<<2);
101         dft(tmp1,1);dft(tmp2,1);
102         for(j=0;j<len;++j)tmp[j]=(LL)tmp1[j]*tmp2[j]%mod;
103         dft(tmp,-1);    
104         for(j=0;j<phi;++j)f[i][j]=(tmp[j]+tmp[j+phi])%mod;
105         v=logv[C(bin[i],bn[i])];
106         if(v!=-1)for(k=0;k<phi;++k)
107             to=(v+k)%phi,f[i][to]=(f[i][to]+f[i-1][k])%mod;
108     }
109     if(opt==1)for(i=0;i<phi;++i)ans[expg[i]]=(ans[expg[i]]+f[lim][i])%mod;
110     else for(i=0;i<phi;++i)ans[expg[i]]=(ans[expg[i]]+mod-f[lim][i])%mod;
111 }
112 int main()
113 {
114     RG int i,j,sum;
115     p=read<int>(),phi=p-1,getroot();
116     while(len<=(p<<1))len<<=1;
117     for(i=0;i<len;++i)
118         if(i&1)rev[i]=(rev[i>>1]>>1)|(len>>1);
119         else rev[i]=rev[i>>1]>>1;
120     poww[0]=poww[len]=1,poww[1]=quick_mod(3,(mod-1)/len);
121     for(i=1;i<len;++i)poww[i]=(LL)poww[i-1]*poww[1]%mod;
122     for(fac[0]=fac[1]=1,i=2;i<p;++i)fac[i]=fac[i-1]*i%p;
123     invf[p-1]=quick_p(fac[p-1],p-2);
124     for(i=p-1;i;--i)invf[i-1]=invf[i]*i%p;
125     LLL n,l,r;
126     n=read<LLL>(),l=read<LLL>(),r=read<LLL>();
127     while(n)bn[++lenn]=n%p,n/=p;
128     calc(r,1),calc(l-1,-1);
129     for(sum=(r-l+1)%mod,i=1;i<p;++i)sum=(sum-ans[i]+mod)%mod;
130     for(printf("%d\n",sum),i=1;i<p;++i)printf("%d\n",ans[i]);
131 }

UOJ#86

四，UOJ#23

留坑待填

五，UOJ#316 NOI2017泳池

去年NOI的试题.......和Cooook研究了一晚上+一上午才研究明白

多项式取模的板子还是打不熟......

首先我们要有一个DP的式子......

这个东西由于你不知道那个矩形在哪飘着所以你很难想

但是一个模糊的思路肯定是有的,就是按列转移

我一开始看这题发现随着宽度变大高度会缩小....然后最后证明这其实是预处理时间复杂度的保障

我们先用类似容斥的想法,设$s_{k}$为最大子矩形小于等于k的概率,那么答案等于$s_{k}-s_{k-1}$

然后我们考虑刚才的按列转移,如果我能算出来对于一个$j*1001$的矩形满足合法要求的概率$legal(j)$,我就枚举这个$j$,然后在它旁边填上一个x就行了

大概画图长这样

那么你可以定义$f(i)$为前i列合法,并且最后一列底下是x的概率

然后统计答案的时候我就求出最后$k+1$个f值,然后在他们后面补充一个第一行没x的合法区间(因为合法解不一定最后一列第一行是x)

那么我们可以写出式子

$$f(i)= \sum _{j=1} ^{ min(i,k) } f(i-j-1)*(1-p)*legal(j) $$

$$ans=\sum _{i=1} ^{k} f(n-i) legal(i)$$

当然你要先判掉$n<=k$

这样我们问题就变成了处理长度为j的区间合法的概率

这东西怎么求呢

我们利用和f的求法类似的求法来预处理

设$g(i,j)$为j列的矩形,前i行全部安全,第$i$行以上未知,并且最后合法的概率

再设$h(i,j)$为j列的矩形,前i行全部安全,第$i$行以上未知,第$j$列的第$i+1$行确定为$x$,并且最后合法的概率

然后我们就用$g$和$h$来回转移

具体的做法,是从高处往低处转移

一开始我们可以直接算出$g(k,1)$,然后我们由第$i+1$行更新第$i$行,枚举第$i+1$行哪个位置是$x$使得我们无法确保第$i+1$行

大概是这样的:

$$g(i,j)=\sum _{k=1} ^ {K/i} h(i,k)*g(i+1,j-k)$$

然后h的转移和它类似

$$h(i,j)=\sum _{k=1} ^ {K/i} h(i,k)*g(i+1,j-k-1)*(1-p)*p^{i}$$

这样,最后求出的$g(1,j)$就是我们刚才定义的$legal(j)$

最后再用上面介绍的矩阵特征多项式优化一下,就可以做到$O(k^{2}+klog_{k}log_{n})$了

一开始我们要先求f的前k项,本题的k很小,所以我选择了$O(k^2)$暴力,其实我们也可以用CDQ分治或者多项式求逆的解法,复杂度更加优秀

同理,求出最后$k+1$项也可以用$FFT$卷积优化,我也用了暴力

其实这题都不用$FFT$和多项式取模,暴力卷积和取模即可

其实我一开始看暴力取模看不懂,后来发现....其实是类似竖式除法的过程

这样这道666的题目就被我们解决了

后记:这题让Cooook有一种加强数据做毒瘤题的冲动.....我及时制止了他23333

那么我们扔代码

  1 #include <cstdio>
  2 #include <algorithm>
  3 #include <cstring>
  4 using namespace std;
  5 #define mod 998244353
  6 #define K 1010
  7 #define L 4096
  8 #define RG register
  9 #define LL long long
 10 inline int quick_mod(int di,int mi)
 11 {
 12     int ret=1;
 13     for(;mi;mi>>=1,di=(LL)di*di%mod)
 14         if(mi&1)ret=(LL)ret*di%mod;
 15     return ret;
 16 }
 17 int n,k,p,q;
 18 int g[K][K],h[K][K],pp[K],f[K<<1],ff[K<<1];
 19 int tmp[L],tmp1[L],tmp2[L],tmp3[L],c[L],d[L],e[L];
 20 inline int min(int a,int b){return a<b?a:b;}
 21 int poww[L],logi[L],rev[L],len=1;
 22 inline void dft(int *a,int ra,int opt)
 23 {
 24     register int i,j,l,d=logi[len]-logi[ra],wn,tmp,*w,*x,*y;
 25     for(i=0;i<ra;++i)if(i<(rev[i]>>d))swap(a[i],a[rev[i]>>d]);
 26     for(d=2;d<=ra;d<<=1)
 27         for(wn=((opt==1)?(len/d):(-len/d)),i=0,l=(d>>1);i<ra;i+=d)
 28             for(w=poww+(opt==1?0:len),j=0,x=a+i,y=x+l;j<l;++j,++x,++y,w+=wn)
 29                 tmp=(LL)(*w)*(*y)%mod,*y=(*x-tmp+mod)%mod,*x=(*x+tmp)%mod;
 30     if(opt==-1)
 31         for(tmp=quick_mod(ra,mod-2),i=0;i<ra;++i)a[i]=(LL)a[i]*tmp%mod;
 32 }
 33 inline int get_inv(int *a,int *ret,int ra)
 34 {
 35     if(ra==1){ret[0]=quick_mod(a[0],mod-2);return 1;}
 36     RG int r1=get_inv(a,ret,(ra+1)>>1),i,la=1;
 37     while(la<(ra<<1))la<<=1;
 38     memcpy(tmp3,a,ra<<2),memset(tmp3+ra,0,(la-ra)<<2);
 39     memset(ret+r1,0,(la-r1)<<2);dft(tmp3,la,1),dft(ret,la,1);
 40     for(i=0;i<la;++i)
 41         ret[i]=((LL)ret[i]*(2ll+mod-((LL)ret[i]*tmp3[i]%mod)))%mod;
 42     dft(ret,la,-1);return ra;
 43 }
 44 inline void rev_copy(int *st,int *to,int ra)
 45     {for(RG int i=0;i<ra;++i)to[i]=st[ra-i-1];}
 46 inline void reverse(int *st,int ra)
 47     {for(RG int t,i=0,j=ra-1;i<j;++i,--j)t=st[i],st[i]=st[j],st[j]=t;}
 48 inline int get_mod(int *a,int ra,int *p,int rp,int *ret)
 49 {
 50     while(ra&&!a[ra-1])--ra;
 51     while(rp&&!p[rp-1])--rp;
 52     if(ra<rp){memcpy(ret,a,ra<<2),memset(ret+ra,0,(rp-ra)<<2);return rp;}
 53     static int tmp1[L],tmp2[L];
 54     RG int i,j,re=ra-rp+1,la=1;
 55     while(la<(re<<1))la<<=1;
 56     rev_copy(p,tmp1,rp);memset(tmp1+re,0,(la-re)<<2);
 57     get_inv(tmp1,tmp2,re);memset(tmp2+re,0,(la-re)<<2);
 58     rev_copy(a,tmp1,ra),memset(tmp1+re,0,(la-re)<<2);
 59     dft(tmp1,la,1);dft(tmp2,la,1);
 60     for(i=0;i<la;++i)tmp1[i]=(LL)tmp1[i]*tmp2[i]%mod;
 61     dft(tmp1,la,-1);
 62     la=1;while(la<ra)la<<=1;
 63     reverse(tmp1,re);memset(tmp1+re,0,(la-re)<<2),dft(tmp1,la,1);
 64     memcpy(tmp2,p,rp<<2),memset(tmp2+rp,0,(la-rp)<<2),dft(tmp2,la,1);
 65     for(i=0;i<la;++i)tmp1[i]=(LL)tmp1[i]*tmp2[i]%mod;
 66     dft(tmp1,la,-1);
 67     for(i=0;i<rp;++i)ret[i]=(a[i]-tmp1[i]+mod)%mod;
 68     memset(ret+rp,0,(la-rp)<<2);
 69     while(rp&&!ret[rp-1])--rp;return rp;
 70 }
 71 inline void mul(int *a,int *b,int *p,int ra,int la)
 72 {
 73     RG int i,j,v,r1=ra+1;
 74     memcpy(tmp,a,r1<<2);memset(tmp+r1,0,(la-r1)<<2);
 75     memcpy(tmp2,b,r1<<2);memset(tmp2+r1,0,(la-r1)<<2);
 76     dft(tmp,la,1),dft(tmp2,la,1);
 77     for(i=0;i<la;++i)tmp[i]=(LL)tmp[i]*tmp2[i]%mod;
 78     dft(tmp,la,-1);
 79     get_mod(tmp,ra<<1+1,p,ra+1,a);
 80 }
 81 inline int calc(int k)
 82 {
 83     if(!k)return quick_mod(q,n);
 84     RG int i,j,u,lim,la=1,ra,r1=k+2,ret=0;
 85     memset(g,0,sizeof(g)),memset(h,0,sizeof(h));
 86     g[k][1]=(LL)pp[k]*q%mod;
 87     g[k][0]=h[k][0]=1;
 88     for(i=k-1;i>0;--i)
 89     {
 90         ra=k/i,g[i][0]=h[i][0]=1;
 91         for(j=1;j<=ra;++j)
 92             for(u=0;u<j;++u)
 93                 h[i][j]=(h[i][j]+(LL)h[i][u]*g[i+1][j-u-1]%mod*pp[i]%mod*q%mod)%mod;
 94         for(j=1;j<=ra;++j)
 95             for(u=0;u<=j;++u)
 96                 g[i][j]=(g[i][j]+(LL)h[i][u]*g[i+1][j-u]%mod)%mod;
 97     }
 98     memset(f,0,sizeof(f)),ra=k+1,f[0]=1;
 99     for(i=1;i<=(ra<<1);++i)
100         for(j=1,lim=min(k+1,i);j<=lim;++j)
101             f[i]=(f[i]+(LL)f[i-j]*g[1][j-1]%mod*q%mod)%mod;
102     if(n<=(ra<<1))
103     {
104         for(i=max(0,n-k);i<=n;++i)
105             ret=(ret+(LL)f[i]*g[1][n-i]%mod)%mod;
106         return ret;
107     }
108     memset(c,0,sizeof(c)),c[1]=1;
109     memset(d,0,sizeof(d)),d[ra]=1;
110     for(i=0;i<ra;++i)d[i]=(mod-(LL)q*g[1][k-i]%mod)%mod;
111     while(la<(r1<<1))la<<=1;
112     memset(e,0,sizeof(e)),e[0]=1;
113     for(lim=n-ra;lim;mul(c,c,d,ra,la),lim>>=1)
114         if(lim&1)mul(e,c,d,ra,la);
115     memset(ff,0,sizeof(ff));
116     for(i=1;i<=ra;++i)
117         for(j=0;j<=k;++j)
118             ff[i]=(ff[i]+(LL)e[j]*f[i+j]%mod)%mod;
119     for(i=1;i<=ra;++i)
120         ret=(ret+(LL)ff[i]*g[1][ra-i])%mod;
121     return ret;
122 }
123 int main()
124 {
125     RG int i,x,y;
126     scanf("%d%d%d%d",&n,&k,&x,&y);
127     logi[1]=0;
128     while(len<=(k+1<<1))len<<=1,logi[len]=logi[len>>1]+1;
129     poww[0]=poww[len]=1,poww[1]=quick_mod(3,(mod-1)/len);
130     for(i=2;i<len;++i)poww[i]=(LL)poww[i-1]*poww[1]%mod;
131     for(i=0;i<len;++i)
132         if(i&1)rev[i]=(rev[i>>1]>>1)|(len>>1);
133         else rev[i]=(rev[i>>1]>>1);
134 
135     p=(LL)x*quick_mod(y,mod-2)%mod,
136     q=(LL)(y-x)*quick_mod(y,mod-2)%mod;
137     for(pp[0]=1,pp[1]=p,i=2;i<=k;++i)pp[i]=(LL)pp[i-1]*p%mod;
138     printf("%d\n",(calc(k)-calc(k-1)+mod)%mod);
139 }

UOJ#316

六，codeforces553E

留坑待填

七，bzoj5093

斯特林数真的是太神了!

我们考虑对于每一个点计算它在每种情况下的贡献

容易发现每个点都是一样的.....那么我们乘个n就行了

然后考虑每个点的贡献应该可以写成这样

$$2^{ C(n-1,2) }* \sum_{i=1} ^{n-1} i^{k}C(n-1,i) $$

所以现在我们就要求后面那个$ \sum_{i=1} ^{n-1} i^{k}C(n-1,i) $

这时候最神的东西就出现了

$$n^{k}= \sum _{j=0} ^{k} S(k,j) * j! *C(n,j) $$

上午我和Cooook说要自己推,结果推不出来.....

不知道这个式子的实际意义是什么.....

但是似乎斯特林数的展开之后也是一堆形如$i^{k}$的形式

也许和这有关?

但是不管了,我们继续推式子,

$$ \sum_{i=1} ^{n-1} i^{k} C(n-1,i) $$

$$=\sum_{i=1} ^{n-1} C(n-1,i) \sum _{j=0} ^{k} S(k,j) * j! *C(n,j) $$

$$=\sum _{j=0} ^{n-1} S(k,j) * j! \sum_{i=j} ^{n-1} C(n-1,i) *C(n,j) $$

那么后面那个$C*C$的是什么玩意?

你想一想实际意义,相当于n个选i个,再i个选j个

相当于对于每j个元素,都会有$2^{n-j}$中不同的选取方案包含j

所以后面那东西就等于$C(n,j)*2^{n-j}$

所以我们的式子就变成了

$$=\sum _{j=0} ^{n-1} S(k,j) * j! C(n,j)*2^{n-j} $$
$$=\sum _{j=0} ^{n-1} S(k,j) * A(n,j)*2^{n-j} $$

这就很有意思了.....那个$A(n,j)$和$2^{n-j}$都可以$O(1)$维护

所以我们用fft优化求第k行斯特林数再按照式子打就行了

丢代码:

 1 #include <cstring>
 2 #include <cstdio>
 3 #include <algorithm>
 4 using namespace std;
 5 #define K 200010
 6 #define LL long long
 7 #define RG register
 8 #define mod 998244353
 9 #define L (1<<19)+10
10 int n,k,fac[K],invf[K],f[L],g[L];
11 inline int min(int a,int b){return a<b?a:b;}
12 inline int quick_mod(int di,int mi)
13 {
14     int ret=1;
15     for(;mi;mi>>=1,di=(LL)di*di%mod)
16         if(mi&1)ret=(LL)ret*di%mod;
17     return ret;
18 }
19 int len=1,rev[L],poww[L];
20 inline void dft(int *a,int opt)
21 {
22     RG int i,j,l,d,tmp,*w,wn,*x,*y;
23     for(i=0;i<len;++i)if(i<rev[i])swap(a[i],a[rev[i]]);
24     for(d=2;d<=len;d<<=1)
25         for(i=0,l=(d>>1),wn=((opt==1)?(len/d):(-len/d));i<len;i+=d)
26             for(w=(poww+((opt==1)?0:len)),j=0,x=a+i,y=x+l;j<l;++x,++y,++j,w+=wn)
27                 tmp=(LL)(*w)*(*y)%mod,*y=(*x+mod-tmp)%mod,*x=(*x+tmp)%mod;
28     if(opt==-1)
29         for(tmp=quick_mod(len,mod-2),i=0;i<len;++i)a[i]=(LL)a[i]*tmp%mod;
30 }
31 int main()
32 {
33     scanf("%d%d",&n,&k);
34     RG int i,j,v,u,ans=(LL)n*quick_mod(  2,(  ((LL)n-1)*(n-2)/2  )%(mod-1)  )%mod;
35     while(len<(k<<1))len<<=1;
36     for(i=0;i<len;++i)
37         if(i&1)rev[i]=(rev[i>>1]>>1)|(len>>1);
38         else rev[i]=(rev[i>>1]>>1);
39     poww[0]=poww[len]=1,poww[1]=quick_mod(3,(mod-1)/len);
40     for(i=2;i<len;++i)poww[i]=(LL)poww[i-1]*poww[1]%mod;
41     for(fac[0]=fac[1]=1,i=2;i<=k;++i)fac[i]=(LL)fac[i-1]*i%mod;
42     for(invf[k]=quick_mod(fac[k],mod-2),i=k;i;--i)invf[i-1]=(LL)invf[i]*i%mod;
43     for(f[0]=0,i=1;i<=k;++i)f[i]=(LL)quick_mod(i,k)*invf[i]%mod;
44     for(i=0,v=1;i<k;++i,v=mod-v)g[i]=(LL)v*invf[i]%mod;
45     dft(f,1),dft(g,1);
46     for(i=0;i<len;++i)f[i]=(LL)f[i]*g[i]%mod;
47     dft(f,-1),--n;
48     RG int tn=n,lim=min(n,k),tmp=0,inv2=499122177;
49     for(v=1,u=quick_mod(2,n),i=0;i<=lim;++i)
50         tmp=(tmp+(LL)f[i]*v%mod*u)%mod,u=(LL)u*inv2%mod,v=(LL)v*tn%mod,--tn;
51     printf("%d\n",(LL)ans*tmp%mod );
52 }

bzoj5093

四，写在最后

FFT的东西很多很杂也很难……有不少思想和题目都非常优秀的题目！

我现在学到的东西也只是沧海一粟而已，如果有不足欢迎指出！

posted @ 2018-02-27 19:18 LadyLex 阅读(1199) 评论(1) 编辑收藏举报

刷新页面返回顶部

LadyLex

暁の水平线に胜利を刻むのです!