转自 z55250825 的几篇关于FFT的博文（一）

关于FFT，咱们都会迫不及待地 @ .....(大雾)(貌似被玩坏了...)

.....0.0学习FFT前先orz FFT君。

首先先是更详细的链接（手写版题解点赞0v0） FFT的资料

其实众所周知的最详细的算法解释在《算法导论》上...然后咱就是边看着那个边码理解的...

首先来看看多项式乘法和快速FFT的关系，然后咱们再来看能否聊到卷积什么的东西...

其实觉得还是去看算法导论最好。

【一.多项式及其表达方式。】

首先什么是多项式额.....实际上就是一个类似这个的东西。

A(x)=∑aj*x^j (0<=j<=n-1)

对于这样一个式子咱们就称它是多项式，这里的 aj 便是系数，然后x 是一个变量，而满足 aj<>0的最大的j是这个多项式的次数，比如 f(x)=1+x+2x^x的次数就是3（它最大的不等于0的ak是k=3的时候a3=2）

然后考虑多项式乘法，咱们先来看看多项式乘法有什么表示方法。

如果没学快速fft之前，咱只会用这样一个式子 A(x)=∑aj*x^j 来表示一个多项式，然后这种方法叫做系数表达法。咱们还有另外一种表达方法，叫做 点值表达法。即咱们在次数为N的 A(x) 任意取N个点xi，求出 yi = A(xi)，然后咱们就可以用N个数对（xi,yi）来表示这个多项式，比如 A(x)=1+x，咱们可以用两个数 (0,1) (1,2) 来表示这个多项式。

为什么可以这样呢？只要咱们可以通过这个N个点表示出这个多项式就可以了。然后最方便的方法自然是设 N个系数为N个未知数，然后可以对N个点列出N个一次的方程，然后解方程即可，由于N个未知数，N个方程，这是显然可以解出来的。所以这种表示法就是正确的。另外实际上这个就是拉格朗日插值定理可以直接构造出来的...最后还有一种更严谨的证明方法见算导的那个矩阵的证明...咱线性代数弱...各种看不懂...但是上面两个比较不严谨的证明的方法应该可以了吧？

上面咱们证明了点值表达式和系数表达式实际上是一样的，由系数表达可以通过枚举N个点算值得到点值表达，然后由点值表达式又可以通过解方程或者插值得到系数表达。它们之间的相互转化实际上就是优化多项式乘法的关键。

实际上多项式乘法，即计算两个n次多项式乘积 A(x)*B(x) 的结果，如果从系数表达考虑的话，实际上是无论如何也得不到一个优化的，复杂度就是O(n^2) 但是假设咱们把角度换到点值表达式的话，会发现只需要O(n)的，首先注意咱们这里的红字的结果指的是，得到最终乘出来的多项式的系数表达或者点值表达即可。这个用点值表示的话，咱们会发现，假设咱们知道了 A(x)的点值表达 (x0,y0),.....(xn-1,yn-1)和 B(x)的点值表达 (x0,y0'),(x1,y1')....(xn-1,yn-1')的话，咱们可以迅速知道结果多项式 C(x)的点值表达式是 (x0,y0*y0') (x1,y1*y1')... (xn-1,yn-1*yn-1')。这个就是O(n)的，也就是说咱们对于多项式乘法，可以在O(n)的时间从两个次数为n的多项式的点值表达得到相乘后的多项式的点值表达，那么咱们的任务实际上就是，考虑如何在O(n^2)以下的时间由点值表达变成系数表达或者由系数表达变成点值表达。

【二.一些复数的证明什么的...】

首先考虑咱们知道一个多项式的系数表达，如何迅速变成点值表达，如果直接枚举 N个点死算的话，咱们会发现，算一个需要O(n)的时间，算n个则是O(n^2)的时间，这个不优化的话显然还是比不上直接暴力。然而咱们的确有O(nlogn)的方法来做这件事情。

先得知道，这里的n个点任意的都是可以的，所以咱们的任务就是找到n个好算的点以便可以O(nlogn)做出来。然后还真有这样的点，那就是 e^(2kπi/n) (0<=k<=n-1)，这个的表示不是特别舒服（尤其是在一大堆这个东西的时候，目测很壮观0.0...），所以咱们就用 w(k,n)表示 e^(2kπi/n)

这里先假设 n 是 2的幂，实际上不是的也可以多算一点让他变成2的幂。

咱们对于次数为n的方程，咱们就求 e^(2kπi/n)（0<=k<=n-1）这n个点的值，其实就是求 w(k,n)的值。为什么用这个求会使复杂度变成O(nlogn)呢？

咱们来看看一些性质：

1）消去定理：对于任何证书 n>=0,k>=0,以及 d>0，咱们有以下的性质：

w(dk,dn)=w(k,n)

证明：

根据定义 w(k,n)=e^(2kπi/n)

w(dk,dn)=e^(2dkπi/dn)=e^(2kπi/n)=w(k,n)

然后由该定理可以导出一个较为关键的东西：

(设n为偶数)w(n/2,n)=w(1,2)=e^(2πi/2)=e^(πi)

e^(πi) 咱们可以由欧拉公式（这个公式怎么证？咱不知道....貌似有本叫费恩曼物理学讲义的有讲过一种推导过程...）

欧拉公式：

咱们可以得到 e^(iπ)=cosπ+isinπ=-1

即：

w(n/2,n)=-1

2)折半定理：如果n>0为偶数，那么n个n次单位的复数根（这个就是w(k,n)们(0<=k<=n-1)）的平方的集合就是n/2个n/2单位的复数根（即w(k,n/2)(0<=k<=n/2-1)）的集合。

证明：首先咱们证明 w(k,n)^2=w(k+n/2,n)^2

首先证明 w(i+j,n)=w(i,n)*w(j,n)，这个为什么对的自己化成 e^blabla 的形式就可以了。

这个实际上就是 w(k+n/2,n)^2=(w(k,n)*w(n/2,n))^2=(w(k,n)*(-1))^2 (w(n/2,n)=-1是上面1)的结果)

=w(k,n)^2

这个证明完了，然后咱们再证明w(k,n)^2=w(k,n/2)即可，这个其实也是消去定理的直接运用。

咱们有 w(k,n)^2=w(2k,n)=w(k,n/2)

即 w(k,n)和w(k+n/2,n)的平方都对应 w(k,n/2)

所以折半定理是正确的。

其实还有一个求和引理的..貌似没看到用所以就先跳过，待会儿如果有需要用了就补上。

【三.DFT和FFT】

实际上咱们这个问题就转化成了求 A（x）在 w(k,n) (0<=k<=n-1)的值，总共n个，咱们把结果 yi 称作系数 ai 的离散傅里叶变换，而离散傅里叶变换又叫DFT。（以前一直以为是FFT的简化版本的...现在看起来应该不是的）

而FFT即在O(nlogn)求出DFT的算法。它是利用了复数根的特殊性来求的。

首先确定咱们现在的问题，是求 A（x）取 w(k,n) 的n个值。

这里先考虑特殊情况，即n为2的幂的情况。

即求 A(x)=a0+a1*x+a2*x^2...+an-1*x^(n-1)在 w(k,n)的n个值。

咱们考虑把 A(x)拆开。

咱们按照 ai的i的奇偶性将他拆成下面两个：

B(x)=a0+a2*x^2+a4*x^4...+a(n-2)*x^(n-2)

C(x)=a1*x+a3*x^3+a5*x^5...+a(n-1)*x^(n-1)

即 A(x)=B(x)+C(x)

然后咱们看到C(x)实际上还有化简的余地额...即

C(x)=x(a1+a3*x^2+a5*x^4...+a(n-1)*x^(n-2))=xD(x)

即 A(x)=B(x)+xD(x)

要求A(x)，实际上求B(x)和D(x)即可。

先考虑求B(x)，如果咱们把 B(x)中的x^2看成 y会发生什么？

咱们会发现问题变成了

求 B(y)=a0+a2*y+a4*y^2....+a(n-2)*y^(n/2-1) 这个式子代入 y=w(k,n)^2 的n个答案。

咱们发现了什么？咱们把w(k,n)^2变成w(k,n/2)，咱们发现，要算的实际上变成了一半了!(折半定理)，即咱们把原问题转化成了这样一个问题，求 B(y)=a0+a2*y+a4*y^2...在 y=w(k,n/2) 的 n/2个答案。

这个的规模貌似和原来的问题相比小了一半额....但是还是这个问题额...

然后咱们递归下去做...一直到 B(y)次数为1的时候（就是a0）的时候，咱们直接返回答案a0即可。

这个就是分治的!复杂度O（nlogn）。

考虑怎么把返回来的答案组合成这个区间的答案。

之前咱们考虑求 A(x)=B(x)+xD(x)，然后B(x)又可以递归求，咱们就可以得到B(x)的n/2个解答，然后咱们把它们复制一遍就是B(x)的n个解，然后咱们的D(x)也是类似的，咱们也复制一遍，再每一个乘以对应的x，在分治的时候复杂度是O(n)的，就可以得到自己的n个解答，由主定理可以得到这样的复杂度就是O(nlogn)。然后由于 w(k+n/2,n)=w(k,n)*w(n/2,n)=-w(k,n)，这个可以只算一半的w即可。剩余一半加负数。

再附上算导上的伪代码把：

Recursive-FFT(A)

n=A.length {n为A的长度}

if n==1 return A

wn=e^(2πi/n)

w=1

B=(A0,A2,...,An-2) {B赋值A的a0,a2...a(n-2)}

D=(A1,A3,...,An-1) {D类似}

yB=Recursive-FFT(B) {递归求B}

yD=Recursive-FFT(D) {递归求D}

for k=0 to n/2-1

Y[k]=yB[k]+wyD[k]

Y[k]+n/2=yB[k]-wyD[k]

w=w*wn

return Y {Y是n个点的答案}

接下来考虑插值...也就是把点值转化为系数。

注意咱们之前系数转化为点权，实际上是求 n个 ∑A(w(k,n))的和，在O(nlogn)的时间内。

而咱们可以证明（这个证明咱还不会...）

aj=∑ykw(-kj,n)/n

然后这个的话实际上和 yj=∑ak*w(kj,n) 是相互逆运算的（乃把这个式子的a看成y,y看成a就可以发现了）

所以这个也可以用FFT转换，咱们先把求出来的y，用O(n)求出乘后的点值表达式，然后把表达式的y看做a,再做一遍转换的FFT,转换的方法就是对于伪代码第四行的那个 wn 一开始初始化为指数为负数的，然后求一遍FFT之后再给求出来的每一个y 除以n，就可以得到多项式乘法后的式子的 a了。这个的复杂度还是O(nlogn)的，所以总的复杂度就是O(nlogn)

【四 FFT的优化及迭代实现啥的】

首先有一个优化叫蝴蝶操作，名字很漂亮但是还是比较简单的...注意到12~13行的 wyD[k] 算了两次，实际上咱们可以只算一次的，咱们用个变量存储它，然后再算。

0.0...然后 vfk 的代码是递归的貌似...不知道该不该看迭代的饿...

vfk的fft

然后迭代的算法其实感觉...比较类似zkw自底向上的做法...递归实际上可以看做一棵完全二叉树（注意咱们已经假设了n是2次幂了）,然后咱们可以类似zkw直接自底向上的做。然后这个咱们可以用那种蝴蝶操作做，问题是咱们得确定叶子节点的顺序。实际上这个的确定的顺序是按某个点是0还是1来的，第一位是0的点全去了左子树，1的去了右子树，咱们按照这个方法按普通DFS遍历一遍数O(n)就可以求出来了。

再给一个算导上的伪代码：

Iterative-FFT(a)

Bit-Reverse-Copy(a,A){算出叶子的顺序存在A中}

n=a.length

for s=1 to lgn

m=2^s

wm=e^2π/m

for k=0 to n-1

w=1

for j=0 to m/2-1

t=wA[k+j+m/2]

u=A[k+j]

A[k+j]=u+t

A[k+j+m/2]=u-t

w=w*wm

Return A

[五入门题目】

哪一个OJ的高精度乘法其实都可以额...

[六卷积咱也不知道是什么...]

只是发现了一个比较好的讲卷积的博文...总算不用纠结连续函数的卷积啥的了0v0

好的卷积

然后貌似看懂了额...

咱们OI一般都是讲离散化的东西...所以这里讲的卷积也是离散化的。

咱们设有两个序列 f[n],g[n]，那么卷积 s[k]=∑f[i]*g[k-i]，很容易证明多项式的每一位的系数实际上就是那一位的卷积。卷积实际上也是一个函数，对于某一个数 k，它的值为 s[k]=∑f[i]*g[k-i]，而多项式乘法实际上就是它们的系数向量的卷积（向量也可以看做一个函数把），然后咱们的快速傅里叶变换（FFT）算法，实际上就是可以在O(nlogn)求出两个函数的卷积。令 A x B 表示 A与B的卷积，即

A x B = DFT^-1(DFT(A)*DFT(B))

【七模板】

（以下排名不分先后，按字典序来）

Evil君的模板

Error君的模板

vfk君的模板

【八实现上的细节】

感觉实现上还是需要理解一下的饿...

首先要知道，咱们只在最后递归到尽头的时候使用了一下a[]来计算，在递归返回的时候实际上它们已经变成了y[]了。

首先是看w[]的变化，每一次往下除以2，实际上可以看做另一部分乘以2，所以咱们预处理出 0~n-1的w是机智的。除以2的实际上就是 1<<t，然后咱们枚举当前能够枚举的数量，乘以这个1<<t就是咱们的w[]，也就是说咱们可以用 i <<t来得到w[]。i的范围为当前能够循环的w的一半，也就是 0~n>>(t+1)-1。即咱们使用w[i shl t]即可。（还有另一半，为负数）

咱们在递归的时候记录一下咱们所得到的a[]的具体信息，然后再来算，首先就是s，s记录的实际上是当前所涉及的所有a[]的公共二进制部分，而以上的可以靠自己枚举了，也就是 0~n>>(t+1)-1（这个是默认剩余部分最低位为0的）它们所对应的就是剩余部分为1的，即再加上个 1<<t即可，分到左边的为 p=i<<(t+1)+s，而其对应的系数应该就是 p+1<<t，然后用蝴蝶操作做即可。

存储的时候使用了一个辅助数组，这里只记了公共部分的。方便查找。

posted @ 2014-07-21 10:54 ZYF-ZYF Views(304) Comments(0) 收藏举报

刷新页面返回顶部

ZYF-ZYF

失败源于不自信

转自 z55250825 的几篇关于FFT的博文（一）