【洛谷】P2408 不同子串个数(后缀数组)

题意

给定一个长度为 n 的字符串,求该字符串含有的本质不同的子串数量。

数据范围

1n105。字符串中只有小写英文字母。

思路

考虑后缀数组求解。

注意到所有后缀的前缀集合就是的子串集合。考虑先将所有的后缀排序。对于第一个后缀,不同的前缀就是它本身的长度,对于第二个后缀,不同的前缀数量就是它本身的长度减去它和第一个后缀的最长公共子串。

对于后面的所有后缀,根据 lcp(i,j)=min(lcp(i,k),(k,j))(ikj)j<i1,必然有 lcp(i,i1)>lcp(i,j)。意思是 i 和前面所有后缀的最长公共前缀就是和前一个后缀的最长公共前缀。

len[i] 表示排序后第 i 个后缀的长度。那么总的不同子串数就是 len[i]height[i]

最后,答案别忘了开 long long

code:

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1e5+10;
int height[N],sa[N],rk[N],x[N],y[N],c[N],n,m; char s[N];
void get_sa()
{
	memset(c,0,sizeof(c));
	for(int i=1;i<=n;i++) c[x[i]=s[i]]++;
	for(int i=2;i<=m;i++) c[i]+=c[i-1];
	for(int i=n;i>=1;i--) sa[c[x[i]]--]=i;
	for(int k=1;k<=n;k<<=1)
	{
		int num=0;
		for(int i=n-k+1;i<=n;i++) y[++num]=i;
		for(int i=1;i<=n;i++) if(sa[i]>k) y[++num]=sa[i]-k;
		for(int i=1;i<=m;i++) c[i]=0;
		for(int i=1;i<=n;i++) c[x[i]]++;
		for(int i=2;i<=m;i++) c[i]+=c[i-1];
		for(int i=n;i>=1;i--) sa[c[x[y[i]]]--]=y[i],y[i]=0;
		swap(x,y),num=1,x[sa[1]]=1;
		for(int i=2;i<=n;i++) x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
		if(n==num) break;m=num;
	}
}
void get_height()
{
	memset(height,0,sizeof(height));
	for(int i=1;i<=n;i++) rk[sa[i]]=i;
	for(int i=1,k=0;i<=n;i++)
	{
		if(rk[i]==1) continue;
		if(k) k--;
		int j=sa[rk[i]-1];
		while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k]) k++;
		height[rk[i]]=k;
	}
}
long long ans;
int main()
{
	int T;scanf("%d",&T);
	while(T--)
	{
		scanf("%s",s+1);m=122;n=strlen(s+1);
		get_sa();get_height();ans=0;
		for(int i=1;i<=n;i++) ans+=n-sa[i]+1-height[i];
		printf("%lld\n",ans);
	}
	return 0;
}
posted @   曙诚  阅读(219)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示