4259. 残缺的字符串

传送门

用 $FFT$ 搞字符串匹配,神仙操作....

对于两个字符串 $A,B$,定义 $dis(A,B)=\sum_i(A_i-B_i)^2$ 

显然当且仅当 $A=B$ 时,$dis(A,B)=0$

这一题还有要求,'*' 为通配符,所以这题的 $dis(A,B)=\sum_i((A_i-B_i)^2[A_i!='*'][B_i!='*'])$ 

发现这时如果设 '*' 为 $0$,则 $dis(A,B)=\sum_i((A_i-B_i)^2A_iB_i)$

对于此题,设 $A$ 串为模板串,那么对于 $B$ 串的一段 $[i-m+1,i]$,如果匹配

则 $dis[i]=\sum_{j=0}^{m-1}((A_j-B_{i-m+1+j})^2A_jB_{i-m+1+j})$

把 $A$ 翻转,变成 $A'$,并在后面补零直到和 $B$ 等长,则 $dis[i]=\sum_{j=0}^{m-1}((A'_j-B_{i-j})^2A'_jB_{i-j})$

展开得到

$dis[i]=\sum_{j=0}^{m-1}{A'}_{j}^{3}B_{i-j}-2\sum_{j=0}^{m-1}{A'}_{j}^{2}B_{i-j}^2+\sum_{j=0}^{m-1}{A'}_{j}B_{i-j}^{3}$

然后三段分别 $FFT$ 就好了

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cmath>
using namespace std;
typedef long long ll;
typedef double db;
inline int read()
{
    int x=0,f=1; char ch=getchar();
    while(ch<'0'||ch>'9') { if(ch=='-') f=-1; ch=getchar(); }
    while(ch>='0'&&ch<='9') { x=(x<<1)+(x<<3)+(ch^48); ch=getchar(); }
    return x*f;
}
const int N=2e6+7;
const db pi=acos(-1.0);
struct CP {
    db x,y;
    CP (db xx=0,db yy=0) { x=xx,y=yy; }
    inline CP operator + (const CP &tmp) const { return CP(x+tmp.x,y+tmp.y); }
    inline CP operator - (const CP &tmp) const { return CP(x-tmp.x,y-tmp.y); }
    inline CP operator * (const CP &tmp) const { return CP(x*tmp.x-y*tmp.y,x*tmp.y+y*tmp.x); }
}A[N],B[N],C[N];
int n,m,p[N];
void FFT(CP *A,int len,int type)
{
    for(int i=0;i<len;i++) if(i<p[i]) swap(A[i],A[p[i]]);
    for(int mid=1;mid<len;mid<<=1)
    {
        CP wn(cos(pi/mid),type*sin(pi/mid));
        for(int R=mid<<1,j=0;j<len;j+=R)
        {
            CP w(1,0);
            for(int k=0;k<mid;k++,w=w*wn)
            {
                CP x=A[j+k],y=w*A[j+mid+k];
                A[j+k]=x+y;
                A[j+mid+k]=x-y;
            }
        }
    }
}
char sa[N],sb[N];
int a[N],b[N],ans[N],Top;
int main()
{
    m=read(),n=read();
    scanf("%s%s",sa,sb);
    for(int i=0;i<m;i++) a[m-i-1]= sa[i]!='*' ? sa[i]-'a'+1 : 0;
    for(int i=0;i<n;i++) b[i]= sb[i]!='*' ? sb[i]-'a'+1 : 0;
    int len=1,tot=0;
    while(len<n+m-1) len<<=1,tot++;
    for(int i=0;i<len;i++) p[i]=(p[i>>1]>>1) | ((i&1)<<(tot-1));

    for(int i=0;i<=len;i++) A[i].x=a[i]*a[i]*a[i],B[i].x=b[i];//此时AB没有值,直接给x赋值就行
    FFT(A,len,1); FFT(B,len,1);
    for(int i=0;i<=len;i++) C[i]=A[i]*B[i];

    for(int i=0;i<=len;i++) A[i]=CP(a[i]*a[i],0),B[i]=CP(b[i]*b[i],0);//注意AB此时有值,要初始化
    FFT(A,len,1); FFT(B,len,1);
    for(int i=0;i<=len;i++) C[i]=C[i]-A[i]*B[i]*CP(2,0);

    for(int i=0;i<=len;i++) A[i]=CP(a[i],0),B[i]=CP(b[i]*b[i]*b[i],0);
    FFT(A,len,1); FFT(B,len,1);
    for(int i=0;i<=len;i++) C[i]=C[i]+A[i]*B[i];

    FFT(C,len,-1);
    for(int i=m-1;i<n;i++) if(C[i].x/len<0.5) ans[++Top]=i-m+2;
    printf("%d\n",Top);
    for(int i=1;i<=Top;i++) printf("%d ",ans[i]);
    if(Top) printf("\n");
    return 0;
}

 

posted @ 2019-07-28 12:24  LLTYYC  阅读(245)  评论(0编辑  收藏  举报