BZOJ3473 字符串 【广义后缀自动机】

题目

给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串?

输入格式

第一行两个整数n,k。
接下来n行每行一个字符串。

输出格式

一行n个整数,第i个整数表示第i个字符串的答案。

输入样例

3 1

abc

a

ab

输出样例

6 1 3

提示

对于 100% 的数据,1<=n,k<=105,所有字符串总长不超过105,字符串只包含小写字母。

题解

我们先建一个广义后缀自动机
然后用每个原串在SAM上走,走到的节点就是parent树的叶子节点,将其沿parent边一直往上+1,表示这些节点表示的字符串+1【当然只能加一次,所以再开一个数组cur[]表示加过没有】
处理完后,我们就可以统计答案了

先拓扑排序,设f[]为该位置满足题意的字符串个数,显然如果一个位置累加的字符串>=k,那么该位置表示的至少为\(step[u] - step[pre[u]]\)
但还不完全,父亲的代表的字符串个数同样也符合该点

然后每个串再在SAM上走一遍统计答案即可

#include<iostream>
#include<cstdio>
#include<cmath>
#include<string>
#include<cstring>
#include<algorithm>
#define LL long long int
#define Redge(u) for (int k = h[u],to; k; k = ed[k].nxt)
#define REP(i,n) for (int i = 1; i <= (n); i++)
#define BUG(s,n) for (int i = 1; i <= (n); i++) cout<<s[i]<<' '; puts("");
using namespace std;
const int maxn = 200005,maxm = 100005,INF = 1000000000;
inline int read(){
	int out = 0,flag = 1; char c = getchar();
	while (c < 48 || c > 57){if (c == '-') flag = -1; c = getchar();}
	while (c >= 48 && c <= 57){out = (out << 3) + (out << 1) + c - 48; c = getchar();}
	return out * flag;
}
string s[maxn];
char ss[maxn];
int ch[maxn][26],pre[maxn],step[maxn],sz[maxn],cnt,last,n,k,cur[maxn];
LL f[maxn];
int ins(int x){
	int p = last,np = ++cnt; step[np] = step[p] + 1; last = np;
	while (p && !ch[p][x]) ch[p][x] = np,p = pre[p];
	if (!p) pre[np] = 1;
	else {
		int q = ch[p][x];
		if (step[q] == step[p] + 1) pre[np] = q;
		else {
			int nq = ++cnt; step[nq] = step[p] + 1;
			for (int i = 0; i < 26; i++) ch[nq][i] = ch[q][i];
			pre[nq] = pre[q]; pre[np] = pre[q] = nq;
			while (ch[p][x] == q) ch[p][x] = nq,p = pre[p];
		}
	}
	return np;
}
int b[maxn],a[maxn];
LL ans;
void tsort(){
	REP(i,cnt) b[step[i]]++;
	REP(i,cnt) b[i] += b[i - 1];
	for (int i = cnt; i; i--) a[b[step[i]]--] = i;
}
int main(){
	n = read(); k = read();
	last = cnt = 1;
	for (int i = 1; i <= n; i++){
		last = 1;
		scanf("%s",ss); s[i] = string(ss);
		int len = strlen(ss);
		for (int i = 0; i < len; i++) ins(ss[i] - 'a');
	}
	int u;
	for (int i = 1; i <= n; i++){
		u = 1;
		for (int j = 0; j < s[i].length(); j++){
			u = ch[u][s[i][j] - 'a'];
			for (int p = u; p && cur[p] != i; p = pre[p])
				sz[p]++,cur[p] = i;
		}
	}
	tsort();
	sz[1] = 0;
	for (int i = 1; i <= cnt; i++)
		u = a[i],f[u] = f[pre[u]] + (sz[u] >= k ? step[u] - step[pre[u]] : 0);
	for (int i = 1; i <= n; i++){
		ans = 0; u = 1;
		for (int j = 0; j < s[i].length(); j++){
			u = ch[u][s[i][j] - 'a'];
			ans += f[u];
		}
		printf("%lld ",ans);
	}
	return 0;
}

posted @ 2018-03-09 21:34  Mychael  阅读(281)  评论(0编辑  收藏  举报