残缺的字符串

残缺的字符串

莫名其妙最后三个点总是T……但是代码是没问题的。

我们设两个串分别为模式串s和文本串t,长度分别为ST,下标从0开始。

先考虑没有通配符的情形。

则如果在t串中以位置x结尾S个字符可以与串s匹配的话,必有i=0S1tx+iS1si=0

这是必要条件,但不是充分条件。当两个串字符完全相同,但字符的顺序不同时,仍有i=0S1tx+iS1si=0

我们当然可以套上绝对值符号,但是套上之后也不会轻松多少。但是,我们可以平方,这样一定保证只有当所有的tx+iS1si=0都成立时,上式才会成立。

我们现在判别式为i=0S1(tx+iS1si)2=0。暴力拆开得i=0S1(tx+iS1)2+i=0S1(si)22i=0S1tx+iS1si=0

注意到这个式子左边的两项是可以O(n)预处理出来的。我们设sum=i=0S1(si)2,f(x)=i=0x(ti)2

则新判别式为f(x)f(xS)+sum2i=0S1tx+iS1si=0

对于右边的一项,我们实在没有什么好办法。

FFT第一项操作:遇事不决就翻转

我们如果翻转s串的话,则原来的si就是新的sSi1

则翻转后,新的判别式为f(x)f(xS)+sum2i=0S1tx+iS1sSi1=0

注意到,右边那个东西的下标之和为x

因此我们可以转换为f(x)f(xS)+sum2i+j=xtisj=0

右边的东西是典型的卷积形式,直接FFT一波带走。

没有通配符的情形,相当于模板的字符串匹配,效果等同于KMP,复杂度为O(nlogn)

代码:

#include<bits/stdc++.h>
using namespace std;
const int N=4e6;
const double pi=acos(-1);
int S,T,lim=1,lg,rev[N],st[N],ss,p[N],cnt;
char s[N],t[N];
struct cp{
	double x,y;
	cp(double u=0,double v=0){x=u,y=v;}
	friend cp operator +(const cp &u,const cp &v){return cp(u.x+v.x,u.y+v.y);}
	friend cp operator -(const cp &u,const cp &v){return cp(u.x-v.x,u.y-v.y);}
	friend cp operator *(const cp &u,const cp &v){return cp(u.x*v.x-u.y*v.y,u.x*v.y+u.y*v.x);}
}f[N],g[N];
void FFT(cp *a,int tp){
	for(int i=0;i<lim;i++)if(i<rev[i])swap(a[i],a[rev[i]]);
	for(int md=1;md<lim;md<<=1){
		cp rt(cos(pi/md),tp*sin(pi/md));
		for(int stp=(md<<1),pos=0;pos<lim;pos+=stp){
			cp w(1,0);
			for(int i=0;i<md;i++,w=w*rt){
				cp x=a[pos+i],y=w*a[pos+md+i];
				a[pos+i]=x+y;
				a[pos+md+i]=x-y;
			}
		}
	}
}
int main(){
	scanf("%s%s",t,s),S=strlen(s),T=strlen(t),reverse(s,s+S);
	while(lim<=S+T)lim<<=1,lg++;
	for(int i=0;i<lim;i++)rev[i]=(rev[i>>1]>>1)|((i&1)<<(lg-1));
	for(int i=0;i<S;i++)ss+=(int)s[i]*s[i];
	for(int i=0;i<T;i++){
		st[i]=(int)t[i]*t[i];
		if(i)st[i]+=st[i-1];
	}
	for(int i=0;i<S;i++)f[i]=cp(s[i],0);
	for(int i=0;i<T;i++)g[i]=cp(t[i],0);
	FFT(f,1),FFT(g,1);
	for(int i=0;i<lim;i++)f[i]=f[i]*g[i];
	FFT(f,-1);
	for(int i=S-1;i<T;i++){
		p[i]=(int)(f[i].x/lim+0.5);
		p[i]=ss+st[i]-2*p[i];
		if(i>=S)p[i]-=st[i-S];
		cnt+=!p[i];
//		printf("%d\n",p[i]);
	}
	printf("%d\n",cnt);
	return 0;
} 

考虑有了通配符后,我们新的判别式。如果我们把通配符的值设成0的话,那么新判别式就是i=0S1(tx+iS1si)2×tx+iS1×si=0

暴力拆开,得i=0S1(tx+iS1)3si+tx+iS1(si)32(tx+iS1)2(si)2=0

暴力翻转,得i+j=xsi(tj)3+i+j=x(si)3tj2i+j=x(si)2(tj)2=0

这样,只要跑6次FFT,求出每个式子的值即可。

被卡常的代码:

#pragma GCC optimize(3)
#include<bits/stdc++.h>
using namespace std;
const double pi=acos(-1);
const int N=1100000; 
int S,T,rev[N],lim=1,lg,ss[N],tt[N];
char s[N],t[N];
struct cp{
	double x,y;
	cp(double u=0,double v=0){x=u,y=v;}
	friend cp operator +(const cp &u,const cp &v){return cp(u.x+v.x,u.y+v.y);}
	friend cp operator -(const cp &u,const cp &v){return cp(u.x-v.x,u.y-v.y);}
	friend cp operator *(const cp &u,const cp &v){return cp(u.x*v.x-u.y*v.y,u.x*v.y+u.y*v.x);}
}f[N],g[N],h[N];
void FFT(cp *a,int tp){
	for(int i=0;i<lim;i++)if(i<rev[i])swap(a[i],a[rev[i]]);
	for(int md=1;md<lim;md<<=1){
		cp rt(cos(pi/md),tp*sin(pi/md));
		for(int stp=md<<1,pos=0;pos<lim;pos+=stp){
			cp w(1,0);
			for(int i=0;i<md;i++,w=w*rt){
				cp x=a[pos+i],y=w*a[pos+md+i];
				a[pos+i]=x+y;
				a[pos+md+i]=x-y;
			}
		}
	}
}
queue<int>q;
signed main(){
	scanf("%d%d%s%s",&S,&T,s,t),reverse(s,s+S);
	while(lim<=(S+T))lim<<=1,lg++;
	for(int i=0;i<lim;i++)rev[i]=(rev[i>>1]>>1)|((i&1)<<(lg-1));
	for(int i=0;i<S;i++)if(s[i]!='*')ss[i]=s[i]-'a'+1;
	for(int i=0;i<T;i++)if(t[i]!='*')tt[i]=t[i]-'a'+1;
	
	for(int i=0;i<lim;i++)f[i]=cp(ss[i]*ss[i]*ss[i],0),g[i]=cp(tt[i],0);
//	for(int i=0;i<S;i++)printf("%lf ",f[i].x);puts("");
//	for(int i=0;i<T;i++)printf("%lf ",g[i].x);puts("");
	FFT(f,1),FFT(g,1);
	for(int i=0;i<lim;i++)h[i]=h[i]+f[i]*g[i];
	
	for(int i=0;i<lim;i++)f[i]=cp(ss[i],0),g[i]=cp(tt[i]*tt[i]*tt[i],0);
//	for(int i=0;i<S;i++)printf("%lf ",f[i].x);puts("");
//	for(int i=0;i<T;i++)printf("%lf ",g[i].x);puts("");
	FFT(f,1),FFT(g,1);
	for(int i=0;i<lim;i++)h[i]=h[i]+f[i]*g[i];
	
	for(int i=0;i<lim;i++)f[i]=cp(ss[i]*ss[i],0),g[i]=cp(tt[i]*tt[i],0);
	FFT(f,1),FFT(g,1);
	for(int i=0;i<lim;i++)h[i]=h[i]-f[i]*g[i]*cp(2,0);
	
	FFT(h,-1);
	for(int i=0;i<lim;i++)h[i].x/=lim;
	for(int i=S-1;i<T;i++)if(fabs(h[i].x)<0.5)q.push(i-S+2);
	printf("%d\n",q.size());
	while(!q.empty())printf("%d ",q.front()),q.pop();
	return 0;
}
posted @   Troverld  阅读(105)  评论(0编辑  收藏  举报
编辑推荐:
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 【杂谈】分布式事务——高大上的无用知识?
点击右上角即可分享
微信分享提示