【洛谷P2408】不同子串个数
题目
题目链接:https://www.luogu.com.cn/problem/P2408
给你一个长为 \(n\) 的字符串,求不同的子串的个数
我们定义两个子串不同,当且仅当有这两个子串长度不一样 或者长度一样且有任意一位不一样。
思路
求出 \(height\) 数组。发现 \(sa\) 数组内两个相邻后缀 \(i-1\) 和 \(i\) 的公共子串有 \(height[i]\) 个,所以第 \(i\) 个后缀的贡献即为 \(len-height[i]\)。
直接等差数列求和求出 \(\sum len\),然后减去 \(height\) 数组的和即可。
时间复杂度 \(O(n\log n)\)。
代码
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=100010;
int n,m,sa[N],height[N],rank[N],c[N],x[N],y[N];
char s[N];
ll ans;
void SA()
{
for (int i=1;i<=n;i++) x[i]=s[i]-'a'+1,c[x[i]]++;
for (int i=2;i<=m;i++) c[i]+=c[i-1];
for (int i=n;i>=1;i--) sa[c[x[i]]--]=i;
for (int k=1;k<=n;k<<=1)
{
int num=0;
for (int i=n-k+1;i<=n;i++) y[++num]=i;
for (int i=1;i<=n;i++) if (sa[i]>k) y[++num]=sa[i]-k;
for (int i=1;i<=m;i++) c[i]=0;
for (int i=1;i<=n;i++) c[x[i]]++;
for (int i=2;i<=m;i++) c[i]+=c[i-1];
for (int i=n;i>=1;i--) sa[c[x[y[i]]]--]=y[i],y[i]=0;
swap(x,y);
x[sa[1]]=1; num=1;
for (int i=2;i<=n;i++)
x[sa[i]]=(y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k]) ? num : ++num;
m=num;
if (n==m) break;
}
}
void geth()
{
for (int i=1;i<=n;i++) rank[sa[i]]=i;
for (int i=1,k=0;i<=n;i++)
{
if (k) k--;
int j=sa[rank[i]-1];
while (s[i+k]==s[j+k]) k++;
height[rank[i]]=k;
}
}
int main()
{
scanf("%d%s",&n,s+1);
ans=1LL*(1+n)*n/2; m=26;
SA();
geth();
for (int i=1;i<=n;i++)
ans-=height[i];
printf("%lld",ans);
return 0;
}