BZOJ 4259: 残缺的字符串 FFT

Description

很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n。可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺。
你想对这两个串重新进行匹配,其中A为模板串,那么现在问题来了,请回答,对于B的每一个位置i,从这个位置开始连续m个字符形成的子串是否可能与A串完全匹配?

Input

第一行包含两个正整数m,n(1<=m<=n<=300000),分别表示A串和B串的长度。
第二行为一个长度为m的字符串A。
第三行为一个长度为n的字符串B。
两个串均仅由小写字母和*号组成,其中*号表示相应位置已经残缺。

Output

第一行包含一个整数k,表示B串中可以完全匹配A串的位置个数。
若k>0,则第二行输出k个正整数,从小到大依次输出每个可以匹配的开头位置(下标从1开始)。
题解:
构造多项式 $C$,设 $C_{j}=\sum_{i=0}^{m-1}(A{i}-B_{i+j})^2\times A_{i}\times B{i+j}$.

不难发现,如果 $C_{i}=0$,则 $B_{j}$ 开始的一段长度为 $m$ 的字符串会与 $A$ 串对应完全相等.

将式子展开,得 $C_{j}=\sum_{i=0}^{m-1}B_{i+j}^{3}+A_{i}^{3}B_{i+j}-2A_{i}^{2}B_{i+j}^{2}$.

将 $A$ 下标反转,来三次 FFT,最终加和即可. 
#include<bits/stdc++.h>     
#define maxn 1200000       
using namespace std; 
void setIO(string s)
{
    string in=s+".in", out=s+".out"; 
    freopen(in.c_str(),"r",stdin); 
    freopen(out.c_str(),"w",stdout);  
} 
#define pi 3.1415926535898
struct cpx
{
    double x,y; 
    cpx(double a=0,double b=0){x=a,y=b;} 
    cpx operator+(const cpx b){ return cpx(x+b.x,y+b.y); }
    cpx operator-(const cpx b){ return cpx(x-b.x,y-b.y); }
    cpx operator*(const cpx b){ return cpx(x*b.x-y*b.y,x*b.y+y*b.x); }   
}a1[maxn],a2[maxn],a3[maxn],b1[maxn],b2[maxn],b3[maxn]; 
void FFT(cpx *a,int n,int flag)
{   
    for(int i=0,k=0;i<n;++i)
    {
        if(i>k) swap(a[i],a[k]); 
        for(int j=n>>1;(k^=j)<j;j>>=1); 
    }
    for(int mid=1;mid<n;mid<<=1)
    {
        cpx wn(cos(pi/mid), flag*sin(pi/mid)),x,y; 
        for(int j=0;j<n;j+=(mid<<1))
        {
            cpx w(1,0);  
            for(int k=0;k<mid;++k) 
            {
                x=a[j+k],y=w*a[j+mid+k];          
                a[j+k]=x+y, a[j+k+mid]=x-y; 
                w=w*wn;     
            }
        }
    }                      
} 
char str1[maxn],str2[maxn];  
int n,m,len=1; 
int arr[maxn],brr[maxn];   
queue<int>Q; 
int main()
{
    // setIO("input");  
    scanf("%d%d%s%s",&n,&m,str1,str2);    
    while(len<n+m)len<<=1;  
    for(int i=0;i<n;++i) arr[n-1-i]=str1[i]=='*'?0.00:(double)str1[i]-'a'+1;   
    for(int i=0;i<m;++i) brr[i]=str2[i]=='*'?0.00:(double)str2[i]-'a'+1; 
    for(int i=0;i<n;++i) a1[i]=cpx(arr[i]*arr[i]*arr[i],0),a2[i]=cpx(arr[i],0), a3[i]=cpx(arr[i]*arr[i],0); 
    for(int i=0;i<m;++i) b1[i]=cpx(brr[i],0), b2[i]=cpx(brr[i]*brr[i]*brr[i],0), b3[i]=cpx(brr[i]*brr[i],0); 
    FFT(a1,len,1),FFT(a2,len,1),FFT(a3,len,1),FFT(b1,len,1),FFT(b2,len,1),FFT(b3,len,1); 
    for(int i=0;i<len;++i) a1[i]=a1[i]*b1[i]+a2[i]*b2[i]-a3[i]*b3[i]-a3[i]*b3[i]; 
    FFT(a1,len,-1);              

    for(int i=0;i+n-1<m;++i) if((int)(a1[i+n-1].x/len+0.1)==0) Q.push(i+1); 
    printf("%d\n",Q.size());
    while(!Q.empty())
    {
        printf("%d ",Q.front()); 
        Q.pop(); 
    }
    return 0; 
} 

  

posted @ 2019-06-11 13:23  EM-LGH  阅读(171)  评论(0编辑  收藏  举报