BZOJ4259 残缺的字符串 多项式 FFT
原文链接http://www.cnblogs.com/zhouzhendong/p/8798532.html
题目传送门 - BZOJ4259
题意
给你两个串,用其中一个来匹配另一个。问从母串的那些位置开始可以匹配模式串。注意有"*"可以匹配任何字符。
串长$\leq 3\times 10^5$。
题解
本题和BZOJ4503几乎一毛一样。
这里直接放BZOJ4503的传送门。
http://www.cnblogs.com/zhouzhendong/p/8536065.html
但是这题要略微卡一卡时间和空间。
这题让我第一次感受到了寻址的效率之慢。
通过测试,同样是访问大约$8400000$个地址,仅通过改变访问顺序,我可以测出最快访问速度大约13倍的最慢访问速度。就是通过改变访问$8400000$个位置的顺序,使得$460MS\rightarrow 5500MS$(谢谢BZOJ测评器,如果我选紫荆花之恋来测试的话可能得到的数据会更好哈哈,但我不敢)。(但这个应该不是上限)
真的是QAQ。
我写的$FFT$中对$w_{t\times j}$的寻址特别慢,所以导致效率慢了约$3000MS$。写成$Claris$的写法,可以把我的程序卡到$5000MS$(虽然精度会稍微差一点但是可以承受)。
代码
#include <bits/stdc++.h> #define y1 ______y1 using namespace std; typedef long long LL; const int N=1<<20; const double PI=acos(-1.0); int n,L,R[N]; struct C{ double r,i; C(){} C(double a,double b){r=a,i=b;} C operator + (C x){return C(r+x.r,i+x.i);} C operator - (C x){return C(r-x.r,i-x.i);} C operator * (C x){return C(r*x.r-i*x.i,r*x.i+i*x.r);} void operator = (double x){r=x,i=0;} }w[N],x1[N],x2[N],y1[N],y2[N],z[N]; int L1,L2,a[N],b[N]; LL res[N]; char s1[N],s2[N]; void FFT(C a[]){ for (int i=0;i<n;i++) if (i<R[i]) swap(a[i],a[R[i]]); for (int t=n>>1,d=1;d<n;d<<=1,t>>=1) for (int i=0;i<n;i+=(d<<1)) for (int j=0,prod=0;j<d;j++,prod+=t){ C tmp=w[prod]*a[i+j+d]; a[i+j+d]=a[i+j]-tmp; a[i+j]=a[i+j]+tmp; } } int ans[N],acnt=0; int main(){ scanf("%d%d%s%s",&L2,&L1,s2,s1); for (int i=0;i<L2/2;i++) swap(s2[i],s2[L2-i-1]); for (int i=0;i<L1;i++) a[i]=s1[i]=='*'?0:(s1[i]-'a'+1); for (int i=0;i<L2;i++) b[i]=s2[i]=='*'?0:(s2[i]-'a'+1); for (n=1,L=0;n<L1+L2;n<<=1,L++); for (int i=0;i<n;i++){ R[i]=(R[i>>1]>>1)|((i&1)<<(L-1)); w[i]=C(cos(2*i*PI/n),sin(2*i*PI/n)); } memset(res,0,sizeof res); for (int i=0;i<n;i++){ x1[i]=1.0*a[i]*a[i]*a[i],y1[i]=1.0*b[i]; x2[i]=1.0*a[i]*a[i],y2[i]=1.0*b[i]*b[i]; } FFT(x1),FFT(x2),FFT(y1),FFT(y2); for (int i=0;i<n;i++){ z[i]=x1[i]*y1[i]-C(2.0,0)*x2[i]*y2[i]; x1[i]=1.0*a[i],y1[i]=1.0*b[i]*b[i]*b[i]; } FFT(x1),FFT(y1); for (int i=0;i<n;i++){ z[i]=z[i]+x1[i]*y1[i]; w[i].i*=-1.0; } FFT(z); for (int i=0;i<n;i++) res[i]=(LL)(z[i].r/n+0.5); for (int i=L2-1;i<L1;i++) if (res[i]==0) ans[++acnt]=i-L2+2; printf("%d\n",acnt); for (int i=1;i<=acnt;i++) printf("%d ",ans[i]); return 0; }