BZOJ 4259: 残缺的字符串 FFT
Description
很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n。可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺。
你想对这两个串重新进行匹配,其中A为模板串,那么现在问题来了,请回答,对于B的每一个位置i,从这个位置开始连续m个字符形成的子串是否可能与A串完全匹配?
Input
第一行包含两个正整数m,n(1<=m<=n<=300000),分别表示A串和B串的长度。
第二行为一个长度为m的字符串A。
第三行为一个长度为n的字符串B。
两个串均仅由小写字母和*号组成,其中*号表示相应位置已经残缺。
Output
第一行包含一个整数k,表示B串中可以完全匹配A串的位置个数。
若k>0,则第二行输出k个正整数,从小到大依次输出每个可以匹配的开头位置(下标从1开始)。
题解:
构造多项式 $C$,设 $C_{j}=\sum_{i=0}^{m-1}(A{i}-B_{i+j})^2\times A_{i}\times B{i+j}$.
不难发现,如果 $C_{i}=0$,则 $B_{j}$ 开始的一段长度为 $m$ 的字符串会与 $A$ 串对应完全相等.
将式子展开,得 $C_{j}=\sum_{i=0}^{m-1}B_{i+j}^{3}+A_{i}^{3}B_{i+j}-2A_{i}^{2}B_{i+j}^{2}$.
将 $A$ 下标反转,来三次 FFT,最终加和即可.
#include<bits/stdc++.h> #define maxn 1200000 using namespace std; void setIO(string s) { string in=s+".in", out=s+".out"; freopen(in.c_str(),"r",stdin); freopen(out.c_str(),"w",stdout); } #define pi 3.1415926535898 struct cpx { double x,y; cpx(double a=0,double b=0){x=a,y=b;} cpx operator+(const cpx b){ return cpx(x+b.x,y+b.y); } cpx operator-(const cpx b){ return cpx(x-b.x,y-b.y); } cpx operator*(const cpx b){ return cpx(x*b.x-y*b.y,x*b.y+y*b.x); } }a1[maxn],a2[maxn],a3[maxn],b1[maxn],b2[maxn],b3[maxn]; void FFT(cpx *a,int n,int flag) { for(int i=0,k=0;i<n;++i) { if(i>k) swap(a[i],a[k]); for(int j=n>>1;(k^=j)<j;j>>=1); } for(int mid=1;mid<n;mid<<=1) { cpx wn(cos(pi/mid), flag*sin(pi/mid)),x,y; for(int j=0;j<n;j+=(mid<<1)) { cpx w(1,0); for(int k=0;k<mid;++k) { x=a[j+k],y=w*a[j+mid+k]; a[j+k]=x+y, a[j+k+mid]=x-y; w=w*wn; } } } } char str1[maxn],str2[maxn]; int n,m,len=1; int arr[maxn],brr[maxn]; queue<int>Q; int main() { // setIO("input"); scanf("%d%d%s%s",&n,&m,str1,str2); while(len<n+m)len<<=1; for(int i=0;i<n;++i) arr[n-1-i]=str1[i]=='*'?0.00:(double)str1[i]-'a'+1; for(int i=0;i<m;++i) brr[i]=str2[i]=='*'?0.00:(double)str2[i]-'a'+1; for(int i=0;i<n;++i) a1[i]=cpx(arr[i]*arr[i]*arr[i],0),a2[i]=cpx(arr[i],0), a3[i]=cpx(arr[i]*arr[i],0); for(int i=0;i<m;++i) b1[i]=cpx(brr[i],0), b2[i]=cpx(brr[i]*brr[i]*brr[i],0), b3[i]=cpx(brr[i]*brr[i],0); FFT(a1,len,1),FFT(a2,len,1),FFT(a3,len,1),FFT(b1,len,1),FFT(b2,len,1),FFT(b3,len,1); for(int i=0;i<len;++i) a1[i]=a1[i]*b1[i]+a2[i]*b2[i]-a3[i]*b3[i]-a3[i]*b3[i]; FFT(a1,len,-1); for(int i=0;i+n-1<m;++i) if((int)(a1[i+n-1].x/len+0.1)==0) Q.push(i+1); printf("%d\n",Q.size()); while(!Q.empty()) { printf("%d ",Q.front()); Q.pop(); } return 0; }