【算法专题】多项式运算与生成函数

【快速傅里叶变换】FFT

参考:从多项式乘法到快速傅里叶变换 by miskcoo

FFT 学习笔记 by Menci

(一)多项式的表示法

系数表示法:f(x)=a[n-1]*x^(n-1)+...+a[0],称为n-1次多项式。

点值表示法:一个n-1次多项式在复数域中有n个根,即n个(x,y)可以唯一确定一个n-1次多项式。

对于一个多项式,从其系数表示法到其点值表示法的变换称为离散傅里叶变换(DFT),反之称为傅里叶逆变换(IDFT)

朴素的离散傅里叶变换,枚举实现的复杂度为O(n^2)。

快速傅里叶变换是指以O(n log n)的复杂度实现IDF和IDFT的算法,常用Cooley-Tukey算法。

(二)复数

复数是形如a+bi的数,当b=0时为实数。

定义一个平面为复平面,那么平面内的每个点(a,b)唯一对应一个复数a+bi,i可以理解为y轴上的单位长度,正如1是x轴上的单位长度。

i的本质是在数轴上定义旋转变换,i是1逆时针旋转90°,那么i^2=-1。

复数相加,遵循平行四边形定则。

复数相乘,模长相乘,幅角相加。

(三)单位根

以圆点为起点,以复平面单位圆的n等分点为终点,作n个向量,设所得幅角为正且最小的向量对应的复数为ω(1,n),即n次单位根。(括号左为上标,右为下标)。

图片来源:OI 中的 FFT by zball

其中B点是单位根ω(1,n),逆时针依次为ω(2,n),ω(3,n)...,ω(n,n)=ω(n,0)=1。

计算公式:ω(k,n)=cos ( 2kπ/n ) + i*sin ( 2kπ/n )

单位根的性质:

(1)消去:ω(2n,2k)=ω(n,k)

(2)折半:ω(n,k+n/2)=-ω(n,k)

将ω(n,0)~ω(n,n-1)这n个单位根作为代表n-1次多项式的n个点的横坐标,可以得到很好的性质。

(四)快速傅里叶变换(FFT解决DFA)

这部分因为不会操作数学公式,直接粘贴Menci博客QAQ。

将n-1次多项式A(x)的系数奇偶分成两个多项式A1(x)和A2(x),则A(x)=A1(x^2)+x*A2(x^2)。

对于k<n/2,有A(ω(n,k))=A1(ω(n/2,k)) + ω(n,k)*A2(ω(n/2,k))

同时,有A(ω(n,k+n/2))=A1(ω(n/2,k)) ω(n,k)*A2(ω(n/2,k))

对于一个k次多项式,通过奇偶分项得到两个k/2次多项式,分别计算后再调用其值解决k次多项式,即分治解决。

(五)傅里叶逆变换(IDFA)

对于n-1次多项式,其n-1维系数向量{a0,a1...an-1}通过DFA得到点值向量{b0,b1...bn-1},反之操作称为IDFA。

将点值向量作为系数,以单位根的倒数进行FFT,得到的每个数除以n,就是IDFA的结果。

(六)迭代实现FFT

对于多项式A(x),已知系数向量a[],求横坐标为ω(n,0)~ω(n,n-1)的点值向量b[]。

将多项式奇偶分项后,对于k<n/2,有A(ω(n,k))=A1(ω(n/2,k)) + ω(n,k)*A2(ω(n/2,k)),同时有A(ω(n,k+n/2))=A1(ω(n/2,k)) ω(n,k)*A2(ω(n/2,k)),分治边界是a[i]*ω(0,0)即a[i]。

边界元素:FFT递归边界的数组排布恰好是原数组每个位置二进制反转后的数字,例如:

原:00 01 10 11

终:00 10 01 11

蝴蝶操作:为了在合并时不引入新数组,进行一下操作。ω(l,k)=ω(n,n/l*k),预处理以n为底的ω[],IDFT时预处理倒数。

t=ω(n/l*k)*a[l/2+k]

a[l/2+k]=a[k]-t

a[k]+=t

(七)多项式乘法

多项式的点值表示法易于进行乘法,因为对于fc(x)=fa(x)*fb(x),每个点x在多项式A,B中的点值相乘即可得到在多项式C中的点值。

将n-1次多项式A和m-1次多项式B均视为n+m-2次多项式(高位补0),进行DFT后相乘再通过IDFT即可得到多项式C。

#include<cstdio>
#include<cstring>
#include<cctype>
#include<cmath>
#include<queue>
#include<stack>
#include<set>
#include<vector>
#include<algorithm>
#define ll long long
#define lowbit(x) x&-x
using namespace std;
int read(){
    char c;int s=0,t=1;
    while(!isdigit(c=getchar()))if(c=='-')t=-1;
    do{s=s*10+c-'0';}while(isdigit(c=getchar()));
    return s*t;
}
int min(int a,int b){return a<b?a:b;}
int max(int a,int b){return a<b?b:a;}
int ab(int x){return x>0?x:-x;}
//int MO(int x){return x>=MOD?x-MOD:x;}
//void insert(int u,int v){tot++;e[tot].v=v;e[tot].from=first[u];first[u]=tot;}
/*------------------------------------------------------------*/
const int inf=0x3f3f3f3f;
const int maxn=300010;//2^18!!!
const double PI=acos(-1);
int n,m;
struct cp{
    double x,y;
    cp(double a,double b){x=a;y=b;}
    cp(){x=y=0;};
    cp operator + (cp a){return cp(x+a.x,y+a.y);}
    cp operator - (cp a){return cp(x-a.x,y-a.y);}
    cp operator * (cp a){return cp(x*a.x-y*a.y,x*a.y+y*a.x);}
}a[maxn],b[maxn];
void fft(cp *a,int n,int f){
    int k=0;
    for(int i=0;i<n;i++){
        if(i>k)swap(a[i],a[k]);
        for(int j=n>>1;(k^=j)<j;j>>=1);
    }
    for(int l=2;l<=n;l<<=1){
        int m=l/2;
        cp wn(cos(2*PI*f/l),sin(2*PI*f/l));
        for(cp *p=a;p!=a+n;p+=l){
            cp w(1,0);
            for(int i=0;i<l/2;i++){
                cp t=w*p[i+m];
                p[i+m]=p[i]-t;
                p[i]=p[i]+t;
                w=w*wn;
            }
        }
    }
    if(f==-1){for(int i=0;i<n;i++)a[i].x/=n;}//
}
int main(){
    scanf("%d%d",&n,&m);n++;m++;
    for(int i=0;i<n;i++){int u;scanf("%d",&u);a[i]=cp(u,0);}
    for(int i=0;i<m;i++){int u;scanf("%d",&u);b[i]=cp(u,0);}
    int N=1;while(N<n+m)N*=2;
    fft(a,N,1);fft(b,N,1);
    for(int i=0;i<N;i++)a[i]=a[i]*b[i];
    fft(a,N,-1);
    for(int i=0;i<n+m-1;i++)printf("%d ",(int)(a[i].x+0.1));
    return 0;
}
View Code

注意:

1.数组空间必须是大于两个卷积数组长度和的2的幂(记为N),当n为1e5时数组空间为300000

2.DFT后的操作一定要以N为单位,例如点值相乘。这个问题在多重fft的题目中很容易写错,多重fft必须把上一个的结果后半部分清零再继续。

3.代码需要手写复数模板来减小常数,NTT还要预处理omega。枚举反二进制的方法是从高位开始模拟进位。

(八)卷积

对于函数f(n)和g(n),定义其卷积为函数(f⊗g)

(fg)(n)=Σf(i)g(n-i),i=0~n。——形式幂级数

卷积的形式和多项式乘法类似,(fg)的生成函数是f(n)和g(n)的生成函数的乘积。

卷积是和为定值的形式,若差为定值,将其中一个数组反转后即可卷积。卷积中多余的部分数组为0,不影响答案。

例题:【BZOJ】2194: 快速傅立叶之二

【BZOJ】3527: [Zjoi2014]力 FFT

高精度乘法:将数字从低位到高位编号0~len-1,每一位代入多项式系数,那么数字乘法就是多项式乘法,最后从低到高处理进位。

(九)模数任意——fft合并

将每个数字拆成a*32768+b,然后四次dft后4次idft合并。

#include<cstdio>
#include<cstring>
#include<cctype>
#include<cmath>
#include<queue>
#include<stack>
#include<set>
#include<vector>
#include<complex>
#include<algorithm>
#define ll long long
#define lowbit(x) x&-x
using namespace std;
int read(){
    char c;int s=0,t=1;
    while(!isdigit(c=getchar()))if(c=='-')t=-1;
    do{s=s*10+c-'0';}while(isdigit(c=getchar()));
    return s*t;
}
int min(int a,int b){return a<b?a:b;}
int max(int a,int b){return a<b?b:a;}
int ab(int x){return x>0?x:-x;}
//int MO(int x){return x>=MOD?x-MOD:x;}
//void insert(int u,int v){tot++;e[tot].v=v;e[tot].from=first[u];first[u]=tot;}
/*------------------------------------------------------------*/
const int inf=0x3f3f3f3f,MOD=1e9+7,maxn=300010;//
const double PI=acos(-1);
namespace fft{
    complex<double>o[maxn],oi[maxn];
    void init(int n){
        for(int k=0;k<n;k++){o[k]=complex<double>(cos(2*PI*k/n),sin(2*PI*k/n));oi[k]=conj(o[k]);}
    }
    void transform(complex<double>*a,int n,complex<double>*o){
        int k=0;
        while((1<<k)<n)k++;
        for(int i=0;i<n;i++){
            int t=0;
            for(int j=0;j<k;j++)if(i&(1<<j))t|=(1<<(k-j-1));
            if(i<t)swap(a[i],a[t]);
        }
        for(int l=2;l<=n;l*=2){
            int m=l/2;
            for(complex<double>*p=a;p!=a+n;p+=l){
                for(int i=0;i<m;i++){
                    complex<double>t=o[n/l*i]*p[i+m];
                    p[i+m]=p[i]-t;
                    p[i]+=t;
                }
            }
        }
    }
    void dft(complex<double>*a,int n){transform(a,n,o);}
    void idft(complex<double>*a,int n){
        transform(a,n,oi);
        for(int i=0;i<n;i++)a[i]/=n;
    }
}
int n,N,m,kind,f[maxn][30],h[30],F[maxn],g[2][maxn];
complex<double>a[maxn],b[maxn],c[maxn],d[maxn],v[maxn];
ll ans1[maxn],ans2[maxn],ans3[maxn],ans4[maxn];//
void multply(complex<double>*x,complex<double>*y,ll *z){
    for(int i=0;i<N;i++)v[i]=x[i]*y[i];
    fft::idft(v,N);
    for(int i=0;i<n;i++)z[i]=(ll)(v[i].real()+0.5);
}
void MTT(int *x,int *y,int *z){
    for(int i=0;i<N;i++)a[i]=b[i]=c[i]=d[i]=complex<double>(0,0);//
    for(int i=0;i<n;i++)a[i].real(x[i]>>15);
    for(int i=0;i<n;i++)b[i].real(x[i]&32767);
    for(int i=0;i<n;i++)c[i].real(y[i]>>15);
    for(int i=0;i<n;i++)d[i].real(y[i]&32767);
    fft::dft(a,N);fft::dft(b,N);fft::dft(c,N);fft::dft(d,N);
    multply(a,c,ans1);multply(a,d,ans2);
    multply(b,c,ans3);
    multply(b,d,ans4);
    for(int i=0;i<n;i++)z[i]=(ans1[i]*32768%MOD*32768%MOD+(ans2[i]+ans3[i])*32768%MOD+ans4[i])%MOD;
}
int main(){
    n=read();m=read();kind=read();
    f[0][0]=1;h[0]=1;
    int mx=0;
    for(mx=1;h[mx-1]<n;mx++)h[mx]=h[mx-1]*m;mx--;
    for(int i=1;i<=n;i++){
        for(int j=0;j<=mx;j++)if(i-h[j]>=0){
            for(int k=0;k<=j;k++)f[i][j]=(f[i][j]+f[i-h[j]][k])%MOD;
        }
    }
    for(int i=0;i<=n;i++)for(int j=0;j<=mx;j++)F[i]=(F[i]+f[i][j])%MOD;
    int x=0;
    for(int i=0;i<=n;i++)g[x][i]=F[i];
    n++;
    N=1;// 
    while(N<n+n)N*=2;fft::init(N);
    for(int k=1;k<kind;k++)MTT(g[x],F,g[1-x]),x=1-x;
    int sum=0;
    for(int i=0;i<=n;i++)sum=(sum+g[x][i])%MOD;
    printf("%d",sum);
    return 0;
}
View Code

注意清空complex的时候实部和虚部(imag)要一起清空。

好看的模板:L_0_Forever_LF

 

【快速数论变换】NTT

只记录重要概念,证明略去。

(一)原根

当(a,m)=1时,对于满足a^x=1(%m)的最小正整数x,称x为a模m的阶。

根据欧拉定理a^φ(m)=1(%m),当x=φ(m)时,称a为m的原根。

以下只讨论m为素数的情况,则当a为m的原根时,a^0~a^(p-2)取遍1~p-1所有值。

模m有原根的充要条件:m=2,4,p^e,2*p^3,p是奇素数。(也就是说,m为素数时一定有原根)

求m的原根:p-1= p1^a1 * p2^a2 * pk^ak,g是p的原根当且仅当对于所有的pi满足g^[ (p-1)/pi ] ≠ 1 (%p)

例题:【51NOD】1135 原根

(二)快速数论变换

当模数为形如p=r*2^k+1的素数(费马素数)时,则有n|p-1,可以进行NTT。

先找到p的原根g(p=998244353 || 1004535809,g=3)

在原来FFT的基础上,omega[i]=g^[ (p-1)/n*i ] % p,倒数为逆元。

IDFT时,除以n改为乘n的逆元。

(三)模数任意的NTT

找到三个费马素数满足相乘结果>n*(m-1)^2,分别进行NTT后用CRT合并。

p=998244353,1004535809,469762049,g=3。

我写的是FFT合并。

(四)离散对数

当(a,p)=1时,若满足a^x=b (%p),则称在模p意义下,x是b以a为底的离散对数,即logab=x(单个快速求解可用BSGS算法)。

1.对于x*y=z(%p),有log x+log y=log z(%p-1),因此离散对数常用于乘法转加法(生成函数)。

2.对于x^y=z(%p),有y*log x=log z(%p-1)。

其中log以p的原根g为底。

例题:【BZOJ】3992: [SDOI2015]序列统计 NTT+生成函数

【生成函数】母函数

生成函数的三大要素:①选择项,②大小,③元素个数。一般最终要求某个“大小”的元素个数。

对于一类组合对象构成的集合A:

1.每个元素a∈A都定义了一个非负整数的”大小“,记为|a|。

2.大小为n的元素个数记为$A_n$。

那么A的一般生成函数是

$$A(x)=\sum_{i=0}^{n}A_ix^i$$

在这里每个元素都抽象成”大小“,元素a可以理解为有|a|的单位元素的元素。

组合对象集合D为A和B的笛卡尔积,即D中的每个元素都是A中某个元素a和B中某个元素b组成的有序二元组(a,b),那么显然有D(x)=A(x)B(x)。

若干一般生成函数的乘积中,第n项的含义是:每个选择项取一个元素,大小相加为n的元素个数。

每个生成函数本质上是一个集合,那么若干生成函数的乘积就是★每个集合取一个元素的组合。例如生成函数A,B,C,A*B*C的每个元素就是有序三元组(a,b,c)。

指数型生成函数是

$$A(x)=\sum_{i=0}^{n}A_i\frac{x^i}{i!}$$

这样就会有:

$$D_n=\sum_{i+j=n}A_iB_j\frac{(i+j)!}{i!j!}=\sum_{i+j=n}A_iB_j\binom{i+j}{i}$$

这里乘(i+j)!是因为这只是系数,后面要除以(i+j)!。

理解为每个元素内部有序就可以了,这样元素内部是排列。

生成函数都是处理对于n个选择项各选一个组成对应”大小“的元素个数,而一般生成函数元素内部是组合,指数型生成函数元素内部是排列

一般生成函数还有个化简公式,令x∈[-1,1]时套等比数列公式即可收敛:

$$\sum_{i=0}^{n}x^i=\frac{1}{1-x}$$

指数型生成函数也有个化简公式——泰勒展开:

$$\sum_{i=0}^{n}\frac{x^i}{i!}=e^x$$

例题:

1.热身:苹果只能取偶数个,橘子只能取1~4个,求拿n个水果的方案数

题解:定义每种水果为一个集合(每个集合选一个),“大小”为水果个数,最后求总集合”大小“为n的元素个数。

f(x)=(1+x^2+x^4+...)*(1+x+x^2+x^3+x^4)。

如果觉得集合很难理解,不妨用”选择项“这个词。

2.【BZOJ】3771: Triple FTT+生成函数

题意:给定n个物品,价值为ai,物品价格互不相同,求选一个或两个或三个的价值为x的方案数,输出所有存在的x和对应方案数。ai<=40000。

题解:要求什么就定义什么为”大小“,所以定义”大小“为价值,[第一个物品][第二个物品][第三个物品]为三个选择项。

那么每个选择项的每个系数记录对应价值的物品数量(1个)。

这样拼起来就好了吗?不是,物品不能重复取,所以拼起来之后再容斥掉选相同的。

我们可以直接写出选一个物品的集合的生成函数f,两个相同物品的g和三个相同物品的h。

考虑有AAB,ABA,BAA,AAA四种不合法情况,答案就是f^3-3f*g+2h。最后这个求得排列数,需要/3!。选1个或2个的随便推推也一样。

3.【BZOJ】3992: [SDOI2015]序列统计 NTT+生成函数

题意:给定一个[0,m-1]范围内的数字集合S,从中选择n个数字(可重复)构成序列。给定x,求序列所有数字乘积%m后为x的序列方案数%1004535809。1<=n<=10^9,3<=m<=8000,m为素数,1<=x<=m-1

题解:要求乘积,定义”大小“为数字的乘积。但是我们不能加减”大小“啊?

换成离散对数就可以了,然后定义每个数字为选择项,答案就是f^n。

4. [母函数]HDU 1521——排列组合 

题意:有n种物品,并且知道每种物品的数量。要求从中选出m件物品的排列数。例如有两种物品A,B,并且数量都是1,从中选2件物品,则排列有”AB”,”BA”两种。

题解:定义”大小“为物品数量,选择项为每种物品,那么组合数就是一般生成函数(元素内部有序,严格按物品编号排),排列数就是指数型生成函数(元素内部带标号,可以打乱)。

这里指数型生成函数,指的是方案就是元素内部带标号的方案数,这样再计算过程中那个公式自动/i!后进行计算再乘回(i+j)!的。

暴力枚举求解这个生成函数。

 

另一部分知识:生成函数公式的化简

参考:什么是生成函数? by M67

首先根据二项式定理:

$$(1+x)^n=\sum_{i=0}^{n}\binom{n}{i}x^i$$

扩展到负数和实数,即广义二项式定理,只要将组合数表示成下降幂即可:

$$(1+x)^{n}=\sum_{i=0}^{\infty}\frac{n^{\underline{i}}}{i!}x^i$$

这里有一个特殊的变换,当n>0时:

$$(1-x)^{-n}=\sum_{i=0}^{\infty}\frac{(-n)^{\underline{i}}}{i!}(-x)^i$$

$$(1-x)^{-n}=\sum_{i=0}^{\infty}\frac{(-1)^i*n^{\overline{i}}}{i!}*(-1)^i*x^i$$

$$(1-x)^{-n}=\sum_{i=0}^{\infty}\binom{n+i-1}{n-1}*x^i$$

所以这是将i个相同的数分割n个非空部分的方案数的生成函数。

另外还常用等比数列递推公式来收敛等比数列:

$$\sum_{i=0}^{\infty}(x^q)^i=\frac{1}{1-x^q}$$

另外对于有限的等比数列还常用类似错位相减的方法,左边乘上(1-x)就会变成右边分子,即:

$$\sum_{i=0}^{n}x^i=\frac{1-x^{n+1}}{1-x}$$

例题:

1.求:

$$g(x)=(1+x^2+x^4+...)(1+x^5+x^{10}+...)(1+x+x^2+x^3+x^4)(1+x)$$

用上面提到的技巧即可得到:

$$g(x)=\frac{1}{1-x^2}*\frac{1}{1-x^5}*\frac{1-x^5}{1-x}*(1+x)$$

不断地约分,最后用平方差公式化简可得:

$$g(x)=\frac{1}{(1-x)^2}=(1-x)^{-2}=\sum_{i=0}^{\infty}(i+1)x^i$$ 

再代入上面那个结论就可以得到多项式了。

2.食物:用上面的技巧化简约分最后剩个小组合数,n=10^500用读入取模。

 

【多项式求逆】

核心原理是$\%x^{\frac{n}{2}}$的多项式平方后可以转化为$\%x^n$。

已知多项式f(x),求多项式g(x),满足f(x)g(x)=1(%x^n)。

$$f(x)g(x)=1(\%x^{\frac{n}{2}})$$

$$f(x)h(x)=1(\%x^n)$$

现在已知g(x),求h(x)。

$$f(x)g(x)-1=0(\%x^{\frac{n}{2}})$$

将1移到左边后就可以平方了。

$$f(x)^2g(x)^2-2f(x)g(x)+1=0(\%x^n)$$

将1换成f(x)*g(x),从而将h(x)代入,提出f(x)消去。

$$f(x)g(x)^2-2g(x)+h(x)=0(\%x^n)$$

最终得到:

$$h(x)=g(x)(2-f(x)g(x))(\%x^n)$$

然后就可以递归求解,边界条件:当n=1时,f(x)g(x)=1(%x),g(0)是f(0)在%MOD意义下的数论逆元。

注意:每次n不同都要重新预处理Omega[]。                                                                                                                              

例题:【BZOJ】4555: [Tjoi2016&Heoi2016]求和 排列组合+多项式求逆 或 斯特林数+NTT

 

【拉格朗日插值法】

参考:拉格朗日插值法(图文详解) by Angel_Kitty

对于一个n次多项式,如果已知n+1个点,可以构造拉格朗日多项式L(x):

$$L(x)=\sum_{i=0}^{n}y_il_i(x)$$

其中$l_i(x)$为插值基函数:

$$l_i(x)=\prod_{j=0,j\neq i}^{n}\frac{x-x_j}{x_i-x_j}$$

通过代入需要的x即可得到答案。

每次插值的复杂度为O(n^2)。

例题:【BZOJ】4559: [JLoi2016]成绩比较 计数DP+排列组合+拉格朗日插值

当横坐标连续时,上式可以表示为:

$$f(x)=\sum_{i=0}^{n}f(i)*\prod_{j=0,j\neq i}^{n}\frac{x-j}{i-j}$$

预处理阶乘的逆元$\frac{1}{i!}$,预处理$v=\prod x-j$,每次乘上v/(i-j),分母是两段阶乘,再根据负数的个数判断正负性。

复杂度O(n)。

例题:【BZOJ】3453: tyvj 1858 XLkxc 拉格朗日插值(自然数幂和)

 

posted @ 2018-02-03 22:27  ONION_CYC  阅读(3043)  评论(0编辑  收藏  举报