字符串数据结构模板/题单(后缀数组,后缀自动机,LCP,后缀平衡树,回文自动机)

模板

后缀数组

#include<bits/stdc++.h>
#define R register int
using namespace std;
const int N=1e6+9;
int sa[N],rk[N],hei[N],x[N],y[N],c[N];
char s[N];
void Rsort(R n,R m){
	for(R i=1;i<=n;++i)++c[x[i]];
	for(R i=2;i<=m;++i)c[i]+=c[i-1];
	for(R i=n;i;--i)sa[c[x[y[i]]]--]=y[i];
}
int main(){
	R n=fread(s+1,1,N,stdin)-1,m=122;
	for(R i=1;i<=n;++i)x[i]=s[i],y[i]=i;
	Rsort(n,m);
	for(R k=1,p=0;k<=n;k<<=1,p=0){
		for(R i=n-k+1;i<=n;++i)y[++p]=i;
		for(R i=1;i<=n;++i)if(sa[i]>k)y[++p]=sa[i]-k;
		memset(c+1,0,4*m);Rsort(n,m);memcpy(y+1,x+1,4*n);
		x[sa[1]]=p=1;
		for(R i=2;i<=n;++i)
			x[sa[i]]=p+=y[sa[i]]!=y[sa[i-1]]||y[sa[i]+k]!=y[sa[i-1]+k];
		if((m=p)==n)break;
	}
	for(R i=1;i<=n;++i)rk[sa[i]]=i;
	for(R i=1,p=0;i<=n;++i){
		for(p-=(bool)p;s[i+p]==s[sa[rk[i]-1]+p];++p);
		hei[rk[i]]=p;
	}
	for(R i=1;i<=n;++i)printf("%d ",sa[i]);puts("");
	for(R i=1;i<=n;++i)printf("%d ",rk[i]);puts("");
	for(R i=1;i<=n;++i)printf("%d ",hei[i]);puts("");
	return 0;
}

后缀自动机

hiho1445 后缀自动机二·重复旋律5

#include<bits/stdc++.h>
#define RG register
#define R RG int
using namespace std;
const int N=2e6+9;
int lst=1,nod=1,ch[N][26],fa[N],len[N];
char s[N];
void Extend(R c){
	R f=lst,p=lst=++nod;
	len[p]=len[f]+1;
	while(f&&!ch[f][c])ch[f][c]=p,f=fa[f];
	if(!f){fa[p]=1;return;}
	R x=ch[f][c];
	if(len[x]==len[f]+1){fa[p]=x;return;}
	R y=++nod;memcpy(ch[y],ch[x],104);
	len[y]=len[f]+1;fa[y]=fa[x];fa[x]=fa[p]=y;
	while(f&&ch[f][c]==x)ch[f][c]=y,f=fa[f];
}
int main(){
	for(char c=getchar();c>='a';c=getchar())Extend(c-'a');
	long long ans=0;
	for(R i=1;i<=nod;++i)ans+=len[i]-len[fa[i]];
	cout<<ans<<endl;
	return 0;
}

广义后缀自动机

注意两个特判
第一个特判是因为已经有这个状态了
第二个特判是因为分裂出y后,p失去意义了
大多数时候,模式串是独立的,可以每次把lst重赋值为1
如果模式串是Trie的话,DFS建SAM会被卡成\(O(叶节点个数×|S|)\)
正确写法是在BFS遍历Trie时进行Extend,详情参考XZY巨佬的总结
洛谷P3346 [ZJOI2015]诸神眷顾的幻想乡

#include<bits/stdc++.h>
#define LL long long
#define RG register
#define R RG int
#define G if(++ip==ie)if(fread(ip=buf,1,SZ,stdin))
using namespace std;
const int SZ=1<<19,N=2e5+9,M=10*N;
char buf[SZ],*ie=buf+SZ,*ip=ie-1;
inline int in(){
	G;while(*ip<'-')G;
	R x=*ip&15;G;
	while(*ip>'-'){x*=10;x+=*ip&15;G;}
	return x;
}
int he[N],ne[N],to[N];
char s[N];
namespace GSAM{
	int nod=1,ch[2*M][10],fa[2*M],len[2*M];
	int Extend(R f,R c){
		if(len[ch[f][c]]==len[f]+1)return ch[f][c];
		R p=++nod;
		len[p]=len[f]+1;
		while(f&&!ch[f][c])ch[f][c]=p,f=fa[f];
		if(!f)return fa[p]=1,p;
		R x=ch[f][c];
		if(len[x]==len[f]+1)return fa[p]=x,p;
		R y=++nod,lst=len[p]==len[f]+1?y:p;
		memcpy(ch[y],ch[x],sizeof(ch[y]));
		len[y]=len[f]+1;fa[y]=fa[x];fa[x]=fa[p]=y;
		while(f&&ch[f][c]==x)ch[f][c]=y,f=fa[f];
		return lst;
	}
	LL calc(){
		LL ans=0;
		for(R i=1;i<=nod;++i)ans+=len[i]-len[fa[i]];
		return ans;
	}
}
namespace Trie{
	int p,ch[M][10],lst[M],q[M];
	void dfs(R&u,R x,R f){
		if(!u)u=++p;
		for(R i=he[x];i;i=ne[i])
			if(to[i]!=f)dfs(ch[u][s[to[i]]],to[i],x);
	}
	void bfs(){
		lst[0]=1;
		for(R h=0,t=0;h<=t;++h)
			for(R x=q[h],y,i=0;i<10;++i)
				if((y=ch[x][i]))lst[q[++t]=y]=GSAM::Extend(lst[x],i);
	}
}
int main(){
	R n=in(),m=in();
	for(R i=1;i<=n;++i)s[i]=in();
	for(R i=1,p=0;i<n;++i){
		R x=in(),y=in();
		ne[++p]=he[x];to[he[x]=p]=y;
		ne[++p]=he[y];to[he[y]=p]=x;
	}
	for(R i=1;i<=n;++i)
		if(!ne[he[i]])Trie::dfs(Trie::ch[0][s[i]],i,0);
	Trie::bfs();
	printf("%lld\n",GSAM::calc());
	return 0;
}

后缀平衡树

不会

回文自动机

会板子了qaq
洛谷日报——强势图解回文自动机
洛谷P3649 [APIO2014]回文串

#include<bits/stdc++.h>
#define LL long long
#define R register int
using namespace std;
const int N=3e5+9;
char s[N];
int lst,nod=1,f[N],ch[N][26],len[N],sum[N];
inline void Extend(R i,R c){
	R p=lst;
	while(s[i-len[p]-1]!=s[i])p=f[p];
	if(!ch[p][c]){
		R q=f[p];
		while(s[i-len[q]-1]!=s[i])q=f[q];
		f[++nod]=ch[q][c];//注意先求fail再给ch赋值
		len[ch[p][c]=nod]=len[p]+2;
	}
	++sum[lst=ch[p][c]];
}
int main(){
	len[f[0]=f[1]=1]=-1;
	cin>>(s+1);
	R n=strlen(s+1);LL ans=0;
	for(R i=1;i<=n;++i)Extend(i,s[i]-'a');
	for(R x=nod;x;--x){//PAM建出来自带拓扑序直接for
		ans=max(ans,(LL)sum[x]*len[x]);
		sum[f[x]]+=sum[x];
	}
	cout<<ans<<endl;
	return 0;
}

题单

hihocoder 重复旋律系列

【Done】重复旋律1(一个串的最长k重可重叠子串)
【Todo】重复旋律2(一个串的最长多重不可重叠子串)
【Done】重复旋律3(两个串的最长公共子串)
【Done】重复旋律4(一个串的周期重复次数最多的子串)
【Done】SAM基本概念
【Done】重复旋律5(一个串的本质不同子串个数)
【Done】重复旋律6(一个串的最长k重可重叠子串(对所有的k求答案))
【Todo】重复旋律7(一个数字串的本质不同子串的数值和)
【Todo】重复旋律8(一个文本串中与某模式串循环同构的子串计数)
【Todo】重复旋律9(字符串上的博弈)

自己发现or分享的一些好题

【Done】洛谷CF666E Forensic Examination
【Todo】洛谷CF700E Cool Slogans
【Todo】HDU5343 MZL's Circle Zhou(vjudge)
【Todo】HDU4622 Reincarnation(vjudge)(可做\(n,q\le10^5\)


【Todo】BZOJ3682 Phorni
【Todo】BZOJ2555 SubString

其他大佬的题单

https://www.cnblogs.com/Macaulish/p/4296557.html
https://www.cnblogs.com/mangoyang/p/9760416.html
https://blog.csdn.net/qq_39898877/article/details/82729385
https://www.cnblogs.com/xzyxzy/p/9186759.html

posted @ 2018-11-29 17:22  Flash_Hu  阅读(1162)  评论(7编辑  收藏  举报