CF1063F-String Journey【SAM,线段树】

正题

题目链接:https://www.luogu.com.cn/problem/CF1063F


题目大意

给出一个字符串,求选出\(k\)个不交子串满足按照起始位置排序后,满足下一个是上一个的真子串。

\(k\)的最大值。

\(1\leq n\leq 5\times 10^5\)


解题思路

首先我们肯定是从短串考虑到长串的,为了方便我们先把字符串翻转一下。

然后考虑一个性质,肯定存在一个最优解的字符串集合是长度每次增加\(1\)的,显然因为如果增加超过\(1\),我们统一删掉这个位置往后的字符串的一段后缀也是合法的。

那么现在长度和答案就可以统一了,设\(f_{i}\)表示以\(i\)结尾的前缀(且最后一个串也以\(i\)结尾)的答案。

那么对于一个\(f_i\)答案的字符集我们把每个串的最后一个字符删去,可以作为\(f_{i-1}\)的答案,所以有\(f_{i-1}\geq f_{i}-1\),也就是\(f_i\)每次最多增加\(1\),那么我们现在就可以暴力处理每个\(f_i\)可能的取值了。

至于一个\(f_i=x\)时该如何判断答案是否正确,也就是字符串\([i-x+1,i]\)能否作为答案,因为子串集长度是每次加\(1\)的,所以上一个只有可能是\([i-x+2,i]\)或者\([i-x+1,i-1]\),我们只需要考虑所有这些串的答案就好了。考虑用SAM,对于每个处理出来的答案\(f_i\)我们可以加入到\(pos_i\)(也就是前缀\([1,i]\)对应的\(SAM\)节点处),然后查询时直接查询子串\([l,r]\)对应节点子树内的最大\(f_i\)即可(因为显然\(f_i\)能做到的\(f_{i}-1\)也能做到,所以我们只需要查询后缀相同的最大值即可)

时间复杂度:\(O(n\log n)\)


code

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<vector>
using namespace std;
const int N=1e6+10,R=20;
int n,pos[N],f[N][R],g[N],rfn[N],ed[N];
int cnt,last,fa[N],len[N],ch[N][26];
char s[N];vector<int> G[N];
struct SegTree{
	int w[N<<2];
	void Change(int x,int L,int R,int pos,int val){
		if(L==R){w[x]=max(w[x],val);return;}
		int mid=(L+R)>>1;
		if(pos<=mid)Change(x*2,L,mid,pos,val);
		else Change(x*2+1,mid+1,R,pos,val);
		w[x]=max(w[x*2],w[x*2+1]);return;
	}
	int Ask(int x,int L,int R,int l,int r){
		if(L==l&&R==r)return w[x];
		int mid=(L+R)>>1;
		if(r<=mid)return Ask(x*2,L,mid,l,r);
		if(l>mid)return Ask(x*2+1,mid+1,R,l,r);
		return max(Ask(x*2,L,mid,l,mid),Ask(x*2+1,mid+1,R,mid+1,r));
	}
}T;
void Ins(int c){
	int p=last,np=last=++cnt;
	len[np]=len[p]+1;
	for(;p&&!ch[p][c];p=fa[p])ch[p][c]=np;
	if(!p)fa[np]=1;
	else{
		int q=ch[p][c];
		if(len[p]+1==len[q])fa[np]=q;
		else{
			int nq=++cnt;len[nq]=len[p]+1;
			memcpy(ch[nq],ch[q],sizeof(ch[nq]));
			fa[nq]=fa[q];fa[q]=fa[np]=nq;
			for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;
		}
	}
	return;
}
void dfs(int x){
	rfn[x]=++cnt;
	for(int i=0;i<G[x].size();i++)
		f[G[x][i]][0]=x,dfs(G[x][i]);
	ed[x]=cnt;return;
}
int getf(int x,int l){
	for(int i=R-1;i>=0;i--)
		if(len[f[x][i]]>=l)x=f[x][i];
	return x;
}
bool check(int i){
	int x=getf(pos[i],g[i]-1);
	if(T.Ask(1,1,cnt,rfn[x],ed[x])>=g[i]-1)return 1;
	x=getf(pos[i-1],g[i]-1);
	if(T.Ask(1,1,cnt,rfn[x],ed[x])>=g[i]-1)return 1;
	return 0;
}
int main()
{
	scanf("%d",&n);
	scanf("%s",s+1);
	reverse(s+1,s+1+n);
	cnt=last=1;
	for(int i=1;i<=n;i++)
		Ins(s[i]-'a'),pos[i]=last;
	for(int i=2;i<=cnt;i++)
		G[fa[i]].push_back(i);
	cnt=0;dfs(1);
	for(int j=1;j<R;j++)
		for(int i=1;i<=cnt;i++)
			f[i][j]=f[f[i][j-1]][j-1];
	int z=1,ans=0;
	for(int i=1;i<=n;i++){
		g[i]=g[i-1]+1;
		while(g[i]>1&&!check(i)){
			T.Change(1,1,cnt,rfn[pos[z]],g[z]);
			g[i]--;z++;
		}
		ans=max(ans,g[i]);
	}
	printf("%d\n",ans);
	return 0;
}
posted @ 2022-02-20 18:12  QuantAsk  阅读(31)  评论(0编辑  收藏  举报