BZOJ3473 字符串 【广义后缀自动机】
题目
给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串?
输入格式
第一行两个整数n,k。
接下来n行每行一个字符串。
输出格式
一行n个整数,第i个整数表示第i个字符串的答案。
输入样例
3 1
abc
a
ab
输出样例
6 1 3
提示
对于 100% 的数据,1<=n,k<=105,所有字符串总长不超过105,字符串只包含小写字母。
题解
我们先建一个广义后缀自动机
然后用每个原串在SAM上走,走到的节点就是parent树的叶子节点,将其沿parent边一直往上+1,表示这些节点表示的字符串+1【当然只能加一次,所以再开一个数组cur[]表示加过没有】
处理完后,我们就可以统计答案了
先拓扑排序,设f[]为该位置满足题意的字符串个数,显然如果一个位置累加的字符串>=k,那么该位置表示的至少为\(step[u] - step[pre[u]]\)
但还不完全,父亲的代表的字符串个数同样也符合该点
然后每个串再在SAM上走一遍统计答案即可
#include<iostream>
#include<cstdio>
#include<cmath>
#include<string>
#include<cstring>
#include<algorithm>
#define LL long long int
#define Redge(u) for (int k = h[u],to; k; k = ed[k].nxt)
#define REP(i,n) for (int i = 1; i <= (n); i++)
#define BUG(s,n) for (int i = 1; i <= (n); i++) cout<<s[i]<<' '; puts("");
using namespace std;
const int maxn = 200005,maxm = 100005,INF = 1000000000;
inline int read(){
int out = 0,flag = 1; char c = getchar();
while (c < 48 || c > 57){if (c == '-') flag = -1; c = getchar();}
while (c >= 48 && c <= 57){out = (out << 3) + (out << 1) + c - 48; c = getchar();}
return out * flag;
}
string s[maxn];
char ss[maxn];
int ch[maxn][26],pre[maxn],step[maxn],sz[maxn],cnt,last,n,k,cur[maxn];
LL f[maxn];
int ins(int x){
int p = last,np = ++cnt; step[np] = step[p] + 1; last = np;
while (p && !ch[p][x]) ch[p][x] = np,p = pre[p];
if (!p) pre[np] = 1;
else {
int q = ch[p][x];
if (step[q] == step[p] + 1) pre[np] = q;
else {
int nq = ++cnt; step[nq] = step[p] + 1;
for (int i = 0; i < 26; i++) ch[nq][i] = ch[q][i];
pre[nq] = pre[q]; pre[np] = pre[q] = nq;
while (ch[p][x] == q) ch[p][x] = nq,p = pre[p];
}
}
return np;
}
int b[maxn],a[maxn];
LL ans;
void tsort(){
REP(i,cnt) b[step[i]]++;
REP(i,cnt) b[i] += b[i - 1];
for (int i = cnt; i; i--) a[b[step[i]]--] = i;
}
int main(){
n = read(); k = read();
last = cnt = 1;
for (int i = 1; i <= n; i++){
last = 1;
scanf("%s",ss); s[i] = string(ss);
int len = strlen(ss);
for (int i = 0; i < len; i++) ins(ss[i] - 'a');
}
int u;
for (int i = 1; i <= n; i++){
u = 1;
for (int j = 0; j < s[i].length(); j++){
u = ch[u][s[i][j] - 'a'];
for (int p = u; p && cur[p] != i; p = pre[p])
sz[p]++,cur[p] = i;
}
}
tsort();
sz[1] = 0;
for (int i = 1; i <= cnt; i++)
u = a[i],f[u] = f[pre[u]] + (sz[u] >= k ? step[u] - step[pre[u]] : 0);
for (int i = 1; i <= n; i++){
ans = 0; u = 1;
for (int j = 0; j < s[i].length(); j++){
u = ch[u][s[i][j] - 'a'];
ans += f[u];
}
printf("%lld ",ans);
}
return 0;
}