【洛谷P2408】不同子串个数

题目

题目链接:https://www.luogu.com.cn/problem/P2408
给你一个长为 \(n\) 的字符串,求不同的子串的个数

我们定义两个子串不同,当且仅当有这两个子串长度不一样 或者长度一样且有任意一位不一样。

思路

求出 \(height\) 数组。发现 \(sa\) 数组内两个相邻后缀 \(i-1\)\(i\) 的公共子串有 \(height[i]\) 个,所以第 \(i\) 个后缀的贡献即为 \(len-height[i]\)
直接等差数列求和求出 \(\sum len\),然后减去 \(height\) 数组的和即可。
时间复杂度 \(O(n\log n)\)

代码

#include <bits/stdc++.h>
using namespace std;
typedef long long ll;

const int N=100010;
int n,m,sa[N],height[N],rank[N],c[N],x[N],y[N];
char s[N];
ll ans;

void SA()
{
	for (int i=1;i<=n;i++) x[i]=s[i]-'a'+1,c[x[i]]++;
	for (int i=2;i<=m;i++) c[i]+=c[i-1];
	for (int i=n;i>=1;i--) sa[c[x[i]]--]=i;
	for (int k=1;k<=n;k<<=1)
	{
		int num=0;
		for (int i=n-k+1;i<=n;i++) y[++num]=i;
		for (int i=1;i<=n;i++) if (sa[i]>k) y[++num]=sa[i]-k;
		for (int i=1;i<=m;i++) c[i]=0;
		for (int i=1;i<=n;i++) c[x[i]]++;
		for (int i=2;i<=m;i++) c[i]+=c[i-1];
		for (int i=n;i>=1;i--) sa[c[x[y[i]]]--]=y[i],y[i]=0;
		swap(x,y);
		x[sa[1]]=1; num=1;
		for (int i=2;i<=n;i++)
			x[sa[i]]=(y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k]) ? num : ++num;
		m=num;
		if (n==m) break;
	}
}

void geth()
{
	for (int i=1;i<=n;i++) rank[sa[i]]=i;
	for (int i=1,k=0;i<=n;i++)
	{
		if (k) k--;
		int j=sa[rank[i]-1];
		while (s[i+k]==s[j+k]) k++;
		height[rank[i]]=k;
	}
}

int main()
{
	scanf("%d%s",&n,s+1);
	ans=1LL*(1+n)*n/2; m=26;
	SA();
	geth();
	for (int i=1;i<=n;i++)
		ans-=height[i];
	printf("%lld",ans);
	return 0;
}
posted @ 2020-10-15 20:32  stoorz  阅读(117)  评论(0编辑  收藏  举报