bzoj3473-字符串

题目

给出\(n\)个字符串,问每个字符串有多少个子串满足这个子串被这\(n\)个字符串中至少\(k\)个字符串包含。(一个字符串本质相同位置不同的子串算多个)。\(1\le k\le n, \sum |s|\le 10^5\)

分析

这是一个多串问题,考虑广义后缀自动机,建出广义后缀树。

在广义后缀树上可以方便地用启发式合并set的方法得到每个点被多少个字符串包含。接着问题就变成了如何查询答案。

直接通过set来更新答案是不现实的。

由于一个字符串本质相同位置不同算多次,所以要求的其实就是对于一个字符串的每个前缀的最长后缀被\(k\)个以上的字符串包含。这可以通过把字符串放进自动机里匹配,如果当前点的被包含数小于\(k\)就条link,跳到一个被包含数大于等于\(k\)的位置,统计这个位置的\(len\),这是因为我们从上一个点跳过来,前缀的一个前缀被去掉,而这个点的\(len\)必定是上一个点的\(minlen-1\),所以一定还在这个串中,即我们要统计的前缀的最长后缀包含数大于等于\(k\)

代码

#include<cstdio>
#include<iostream>
#include<string>
#include<vector>
#include<cstring>
#include<set>
#include<algorithm>
using namespace std;
typedef long long giant;
const int maxn=1e5+10;
const int maxm=maxn<<1;
const int maxc=26;
string s[maxn];
set<int> st[maxm];
int n,k,cnt[maxm];
struct TREE {
	vector<int> g[maxm];
	void add(int x,int y) {g[x].push_back(y);}
	void merge(set<int> &a,set<int> &b) {
		if (a.size()<b.size()) a.swap(b);
		for (int x:b) a.insert(x);
		b.clear();
	}
	void dfs(int x) {
		for (int v:g[x]) {
			dfs(v);
			merge(st[x],st[v]);
		}
		cnt[x]=st[x].size();
	}
} tree;
struct SAM {
	int t[maxm][maxc],len[maxm],link[maxm],tot,last;
	SAM ():tot(1),last(1) {}
	void reset() {last=1;}
	void add(int x,int id) {
		if (t[last][x]) {
			int p=t[last][x];
			if (len[p]==len[last]+1) {
				st[last=p].insert(id);
				return;
			} 
			int q=++tot;
			len[q]=len[last]+1;
			memcpy(t[q],t[p],sizeof t[p]);
			for (int j=last;j && t[j][x]==p;j=link[j]) t[j][x]=q; 
			link[q]=link[p],link[p]=q;
			st[last=q].insert(id);
			return;
		}
		int nw=++tot,i;
		len[nw]=len[last]+1;
		for (i=last;i && !t[i][x];i=link[i]) t[i][x]=nw;
		if (i) {
			int p=t[i][x];
			if (len[p]==len[i]+1) link[nw]=p; else {
				int q=++tot;
				len[q]=len[i]+1;
				memcpy(t[q],t[p],sizeof t[p]);
				for (int j=i;j && t[j][x]==p;j=link[j]) t[j][x]=q;
				link[q]=link[p],link[p]=link[nw]=q;
			}
		} else link[nw]=1;
		st[last=nw].insert(id);
	}
	void build() {
		for (int i=2;i<=tot;++i) tree.add(link[i],i);
	}
	giant run(string &s) {
		int m=s.length(),now=1;
		giant ret=0;
		for (int i=0;i<m;++i) {
			char c=s[i];
			while (now!=1 && !t[now][c-'a']) now=link[now];
			if (t[now][c-'a']) now=t[now][c-'a'];
			while (now!=1 && cnt[now]<k) now=link[now];
			if (cnt[now]>=k) ret+=(giant)len[now];
		}
		return ret;
	}
} sam;	
int main() {
#ifndef ONLINE_JUDGE
	freopen("test.in","r",stdin);
#endif
	ios::sync_with_stdio(false);
	cin>>n>>k;
	for (int i=1;i<=n;++i) {
		string &str=s[i];
		cin>>str;
		int len=str.length();
		sam.reset();
		for (int j=0;j<len;++j) sam.add(str[j]-'a',i);
	}
	sam.build();
	tree.dfs(1);
	for (int i=1;i<=n;++i) cout<<sam.run(s[i])<<" ";
	cout<<endl;
	return 0;
}
posted @ 2017-07-10 09:52  permui  阅读(424)  评论(0编辑  收藏  举报