[JZOJ3337] 【NOI2013模拟】wyl8899的TLE

题目

题目大意

给你两个字符串\(A\)\(B\),可以修改\(A\)中的一个字符,求修改后最长的\(A\)的前缀,使它是\(B\)的子串。


思考历程

看到这道题之后,第一眼想到的就是后缀自动机!
\(B\)的子串,意味着可以把\(B\)建立一个后缀自动机,然后在上面跑……
刚开始的想法是将\(A\)在上面跑,并且试着修改后面一个字符,看看剩下的可以跑多长……
于是问题就转化成求这样的一个东西:问\(A\)的某个后缀从后缀自动机上的某个节点开始最多能跑多远。
我试着将这个东西预处理出来……可是没有成功……
交了个错误的程序上去,居然还有点分。


水法

这题不得不开“水法”这一栏目。
题目的数据真是太水了,各种暴力都能过。
最简单的暴力:枚举子串的左端点,然后暴力匹配,遇见的第一个不同就用掉修改机会,求出匹配的最大长度。
还有一种\(O(n)\)的正确性显然错误的DP……
跑得都比正解快……

正解

有个exkmp的方法,虽然说时间可能会有点玄学,但既然是郑姐讲的方法,就把它归为“正解”这一栏吧……
求出\(A\)\(next\),以\(A\)为模式串求出\(B\)\(extend\)
枚举子串的开头\(i\),则后面相同的子串长度为\(extend_i\)
后面那个位置用修改操作,所以要从\(A_{extend_i+2}\)\(B_{i+extend_i+1}\)开始继续匹配。
接下来取\(\min(next_{extend_i+2},extend_{i+extend_i+1})\)。后面这个长度的串一定是相同的,因为前者等于\(A\)前面一段,后者也等于\(A\)前面一段,其中的最小值就是它们相等的长度。
然而这可能不是极限,所以后面的,就暴力判断吧……
时间应该比较优秀,虽然说那一部分暴力判断有点玄学……

然后是题解中的\(LCP\)做法。
先枚举子串的左端点\(i\),求\(LCP(B_{i..m},A)\),设为\(x\)\(x+1\)位可以用修改机会,然后求\(LCP(A_{x+2..n},B_{i+x+1..m})\),就是后面能继续延伸的长度。
当然,记得判断一下到达边界的情况。
至于求\(LCP\),最典型的做法是用后缀数组,将\(A\)\(B\)并在一起,中间用特殊字符隔开,然后求后缀数组和\(height\)数组,然后用数据结构维护区间\(height\)最小值。
还有一种做法是用后缀自动机。考虑利用\(fail\)指针,如果跳两个节点在\(fail\)树上的\(LCA\),它的\(len\)就是它们的最长公共后缀。要求最长公共前缀,就把字符串倒过来建后缀自动机就行了……(\(fail\)树实际上是逆序字符串的后缀树)这是两个字符串,所以要建广义后缀自动机。

最后是许多人使用的二分和\(hash\)做法。
首先二分答案\(k\),将\(B\)串中长度为\(k\)的子串存入\(hash\)表。
然后\(26n\)来枚举修改的方案,每次修改后再\(hash\)表中查询。


代码

后缀自动机的做法……

using namespace std;
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cassert>
#define N 50010
int n,m;
char a[N],b[N];
struct Node{
	Node *c[26],*fail;
	int len;
} d[N*4];
int cnt;
Node *S,*last;
inline void insert(int ch){
	if (last->c[ch] && last->c[ch]->len==last->len+1){
		last=last->c[ch];
		return;
	}
	Node *nw=&d[++cnt],*p;
	nw->len=last->len+1;
	for (p=last;p && !p->c[ch];p=p->fail)
		p->c[ch]=nw;
	if (!p)
		nw->fail=S;
	else{
		Node *q=p->c[ch];
		if (p->len+1==q->len)
			nw->fail=q;
		else{
			Node *clone=&d[++cnt];
			memcpy(clone,q,sizeof(Node));
			clone->len=p->len+1;
			for (;p && p->c[ch]==q;p=p->fail)
				p->c[ch]=clone;
			nw->fail=q->fail=clone;
		}
	}
	last=nw;
}
int sta[N],stb[N];
int fa[N*4][17],dep[N*4];
int get_dep(int x){
	if (dep[x])
		return dep[x];
	if (!fa[x][0])
		return dep[x]=1;
	return dep[x]=get_dep(fa[x][0])+1;
}
int LCP(int u,int v){
	if (dep[u]<dep[v])
		swap(u,v);
	for (int k=dep[u]-dep[v],i=0;k;k>>=1,++i)
		if (k&1)
			u=fa[u][i];
	if (u==v)
		return d[u].len;
	for (int i=16;i>=0;--i)
		if (fa[u][i]!=fa[v][i])
			u=fa[u][i],v=fa[v][i];
	return d[fa[u][0]].len;
}
int main(){
	scanf("%s%s",a+1,b+1);
	n=strlen(a+1),m=strlen(b+1);
	n=min(n,m);
	last=S=&d[++cnt];
	for (int i=m;i>=1;--i){
		insert(b[i]-'a');
		stb[i]=last-d;
	}
	last=S;
	for (int i=n;i>=1;--i){
		insert(a[i]-'a');
		sta[i]=last-d;
	}
	fa[1][0]=0;
	for (int i=2;i<=cnt;++i)
		fa[i][0]=d[i].fail-d;
	for (int i=1;i<=cnt;++i)
		get_dep(i);
	for (int i=1;i<=16;++i)
		for (int j=1;j<=cnt;++j)
			fa[j][i]=fa[fa[j][i-1]][i-1];
	int ans=0;
	for (int i=1;i<=m;++i){
		int lcp=LCP(stb[i],sta[1]);
		if (lcp==n || lcp==n-1){
			printf("%d\n",n);
			return 0;
		}
		ans=max(ans,lcp+(i+lcp<=m?1:0)+(i+lcp+1<=m?LCP(stb[i+lcp+1],sta[1+lcp+1]):0));
	}
	printf("%d\n",ans);
	return 0;
}

总结

这题应该算是一道套路题吧……
所以看题的时候,不要试着死磕一个地方,要多方面地去考虑……
比如,枚举左端点右端点什么的……

posted @ 2019-07-09 22:19  jz_597  阅读(143)  评论(0编辑  收藏  举报