字符串数据结构模板/题单(后缀数组,后缀自动机,LCP,后缀平衡树,回文自动机)
模板
后缀数组
#include<bits/stdc++.h>
#define R register int
using namespace std;
const int N=1e6+9;
int sa[N],rk[N],hei[N],x[N],y[N],c[N];
char s[N];
void Rsort(R n,R m){
for(R i=1;i<=n;++i)++c[x[i]];
for(R i=2;i<=m;++i)c[i]+=c[i-1];
for(R i=n;i;--i)sa[c[x[y[i]]]--]=y[i];
}
int main(){
R n=fread(s+1,1,N,stdin)-1,m=122;
for(R i=1;i<=n;++i)x[i]=s[i],y[i]=i;
Rsort(n,m);
for(R k=1,p=0;k<=n;k<<=1,p=0){
for(R i=n-k+1;i<=n;++i)y[++p]=i;
for(R i=1;i<=n;++i)if(sa[i]>k)y[++p]=sa[i]-k;
memset(c+1,0,4*m);Rsort(n,m);memcpy(y+1,x+1,4*n);
x[sa[1]]=p=1;
for(R i=2;i<=n;++i)
x[sa[i]]=p+=y[sa[i]]!=y[sa[i-1]]||y[sa[i]+k]!=y[sa[i-1]+k];
if((m=p)==n)break;
}
for(R i=1;i<=n;++i)rk[sa[i]]=i;
for(R i=1,p=0;i<=n;++i){
for(p-=(bool)p;s[i+p]==s[sa[rk[i]-1]+p];++p);
hei[rk[i]]=p;
}
for(R i=1;i<=n;++i)printf("%d ",sa[i]);puts("");
for(R i=1;i<=n;++i)printf("%d ",rk[i]);puts("");
for(R i=1;i<=n;++i)printf("%d ",hei[i]);puts("");
return 0;
}
后缀自动机
#include<bits/stdc++.h>
#define RG register
#define R RG int
using namespace std;
const int N=2e6+9;
int lst=1,nod=1,ch[N][26],fa[N],len[N];
char s[N];
void Extend(R c){
R f=lst,p=lst=++nod;
len[p]=len[f]+1;
while(f&&!ch[f][c])ch[f][c]=p,f=fa[f];
if(!f){fa[p]=1;return;}
R x=ch[f][c];
if(len[x]==len[f]+1){fa[p]=x;return;}
R y=++nod;memcpy(ch[y],ch[x],104);
len[y]=len[f]+1;fa[y]=fa[x];fa[x]=fa[p]=y;
while(f&&ch[f][c]==x)ch[f][c]=y,f=fa[f];
}
int main(){
for(char c=getchar();c>='a';c=getchar())Extend(c-'a');
long long ans=0;
for(R i=1;i<=nod;++i)ans+=len[i]-len[fa[i]];
cout<<ans<<endl;
return 0;
}
广义后缀自动机
注意两个特判
第一个特判是因为已经有这个状态了
第二个特判是因为分裂出y后,p失去意义了
大多数时候,模式串是独立的,可以每次把lst重赋值为1
如果模式串是Trie的话,DFS建SAM会被卡成
正确写法是在BFS遍历Trie时进行Extend,详情参考XZY巨佬的总结
洛谷P3346 [ZJOI2015]诸神眷顾的幻想乡
#include<bits/stdc++.h>
#define LL long long
#define RG register
#define R RG int
#define G if(++ip==ie)if(fread(ip=buf,1,SZ,stdin))
using namespace std;
const int SZ=1<<19,N=2e5+9,M=10*N;
char buf[SZ],*ie=buf+SZ,*ip=ie-1;
inline int in(){
G;while(*ip<'-')G;
R x=*ip&15;G;
while(*ip>'-'){x*=10;x+=*ip&15;G;}
return x;
}
int he[N],ne[N],to[N];
char s[N];
namespace GSAM{
int nod=1,ch[2*M][10],fa[2*M],len[2*M];
int Extend(R f,R c){
if(len[ch[f][c]]==len[f]+1)return ch[f][c];
R p=++nod;
len[p]=len[f]+1;
while(f&&!ch[f][c])ch[f][c]=p,f=fa[f];
if(!f)return fa[p]=1,p;
R x=ch[f][c];
if(len[x]==len[f]+1)return fa[p]=x,p;
R y=++nod,lst=len[p]==len[f]+1?y:p;
memcpy(ch[y],ch[x],sizeof(ch[y]));
len[y]=len[f]+1;fa[y]=fa[x];fa[x]=fa[p]=y;
while(f&&ch[f][c]==x)ch[f][c]=y,f=fa[f];
return lst;
}
LL calc(){
LL ans=0;
for(R i=1;i<=nod;++i)ans+=len[i]-len[fa[i]];
return ans;
}
}
namespace Trie{
int p,ch[M][10],lst[M],q[M];
void dfs(R&u,R x,R f){
if(!u)u=++p;
for(R i=he[x];i;i=ne[i])
if(to[i]!=f)dfs(ch[u][s[to[i]]],to[i],x);
}
void bfs(){
lst[0]=1;
for(R h=0,t=0;h<=t;++h)
for(R x=q[h],y,i=0;i<10;++i)
if((y=ch[x][i]))lst[q[++t]=y]=GSAM::Extend(lst[x],i);
}
}
int main(){
R n=in(),m=in();
for(R i=1;i<=n;++i)s[i]=in();
for(R i=1,p=0;i<n;++i){
R x=in(),y=in();
ne[++p]=he[x];to[he[x]=p]=y;
ne[++p]=he[y];to[he[y]=p]=x;
}
for(R i=1;i<=n;++i)
if(!ne[he[i]])Trie::dfs(Trie::ch[0][s[i]],i,0);
Trie::bfs();
printf("%lld\n",GSAM::calc());
return 0;
}
后缀平衡树
不会
回文自动机
会板子了qaq
洛谷日报——强势图解回文自动机
洛谷P3649 [APIO2014]回文串
#include<bits/stdc++.h>
#define LL long long
#define R register int
using namespace std;
const int N=3e5+9;
char s[N];
int lst,nod=1,f[N],ch[N][26],len[N],sum[N];
inline void Extend(R i,R c){
R p=lst;
while(s[i-len[p]-1]!=s[i])p=f[p];
if(!ch[p][c]){
R q=f[p];
while(s[i-len[q]-1]!=s[i])q=f[q];
f[++nod]=ch[q][c];//注意先求fail再给ch赋值
len[ch[p][c]=nod]=len[p]+2;
}
++sum[lst=ch[p][c]];
}
int main(){
len[f[0]=f[1]=1]=-1;
cin>>(s+1);
R n=strlen(s+1);LL ans=0;
for(R i=1;i<=n;++i)Extend(i,s[i]-'a');
for(R x=nod;x;--x){//PAM建出来自带拓扑序直接for
ans=max(ans,(LL)sum[x]*len[x]);
sum[f[x]]+=sum[x];
}
cout<<ans<<endl;
return 0;
}
题单
hihocoder 重复旋律系列
【Done】重复旋律1(一个串的最长k重可重叠子串)
【Todo】重复旋律2(一个串的最长多重不可重叠子串)
【Done】重复旋律3(两个串的最长公共子串)
【Done】重复旋律4(一个串的周期重复次数最多的子串)
【Done】SAM基本概念
【Done】重复旋律5(一个串的本质不同子串个数)
【Done】重复旋律6(一个串的最长k重可重叠子串(对所有的k求答案))
【Todo】重复旋律7(一个数字串的本质不同子串的数值和)
【Todo】重复旋律8(一个文本串中与某模式串循环同构的子串计数)
【Todo】重复旋律9(字符串上的博弈)
自己发现or分享的一些好题
【Done】洛谷CF666E Forensic Examination
【Todo】洛谷CF700E Cool Slogans
【Todo】HDU5343 MZL's Circle Zhou(vjudge)
【Todo】HDU4622 Reincarnation(vjudge)(可做)
【Todo】BZOJ3682 Phorni
【Todo】BZOJ2555 SubString
其他大佬的题单
https://www.cnblogs.com/Macaulish/p/4296557.html
https://www.cnblogs.com/mangoyang/p/9760416.html
https://blog.csdn.net/qq_39898877/article/details/82729385
https://www.cnblogs.com/xzyxzy/p/9186759.html
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 在鹅厂做java开发是什么体验
· 百万级群聊的设计实践
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战
· 永远不要相信用户的输入:从 SQL 注入攻防看输入验证的重要性
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析