BZOJ_3998_[TJOI2015]弦论_后缀自动机

BZOJ_3998_[TJOI2015]弦论_后缀自动机

Description

对于一个给定长度为N的字符串,求它的第K小子串是什么。

Input

 第一行是一个仅由小写英文字母构成的字符串S

第二行为两个整数T和K,T为0则表示不同位置的相同子串算作一个。T=1则表示不同位置的相同子串算作多个。K的意义如题所述。

Output

输出仅一行,为一个数字串,为第K小的子串。如果子串数目不足K个,则输出-1

Sample Input

aabc
0 3

Sample Output

aab

HINT

N<=5*10^5

T<2
K<=10^9

首先肯定是要一位一位确定字符,这样我们就需要两个标记。
建出后缀自动机。
设siz[i]表示i对应状态在串中出现了多少次,f[i]表示i对应子串有多少种转移方法。
siz[i]比较好求,如果表示不同位置的相同子串算作一个所有siz都为1,否则siz可以通过后缀树DP出来。
f[i]用拓扑序DP出来,初始值为siz。
然后按位确定每一位的字符即可。
 
代码:
#include <cstdio>
#include <string.h>
#include <algorithm>
using namespace std;
#define N 1000050
int ch[N][26],fa[N],dep[N],siz[N],cnt=1,lst=1,f[N];
int ws[N],a[N];
char w[N];
void insert(int x) {
	int p=lst,np=++cnt,q,nq;
	lst=np; dep[np]=dep[p]+1;
	for(;p&&!ch[p][x];p=fa[p]) ch[p][x]=np;
	if(!p) fa[np]=1;
	else {
		q=ch[p][x];
		if(dep[q]==dep[p]+1) fa[np]=q;
		else {
			fa[nq=++cnt]=fa[q];
			dep[nq]=dep[p]+1;
			memcpy(ch[nq],ch[q],sizeof(ch[q]));
			fa[q]=fa[np]=nq;
			for(;p&&ch[p][x]==q;p=fa[p]) ch[p][x]=nq;
		}
	}
	siz[np]=1;
}
void print() {
	int i,j;
	printf("test-------------------------------------------\n");
	for(i=1;i<=cnt;i++) {
		printf("p=%d,siz=%d,dep=%d,fa=%d\n",i,siz[i],dep[i],fa[i]);
		for(j=0;j<26;j++) {
			if(ch[i][j]) {
				printf("ch(%d)(%c)=%d\n",i,j+'a',ch[i][j]);
			}
		}
	}
	printf("lst=%d\n",lst);
}
int main() {
	int T,K;
	scanf("%s%d%d",w+1,&T,&K);
	int n=strlen(w+1);
	int i,j,p;
	for(i=1;i<=n;i++) insert(w[i]-'a');
	for(i=1;i<=cnt;i++) ws[dep[i]]++;
	for(i=1;i<=n;i++) ws[i]+=ws[i-1];
	for(i=cnt;i;i--) a[ws[dep[i]]--]=i;
	if(T) {
		for(i=cnt;i;i--) {
			p=a[i]; siz[fa[p]]+=siz[p];
		}
	}else for(i=cnt;i;i--) siz[a[i]]=1;
	for(siz[1]=0,i=cnt;i;i--) {
		p=a[i];
		for(f[p]=siz[p],j=0;j<26;j++) f[p]+=f[ch[p][j]];
	}
	if(f[1]<K) puts("-1");
	else {
		p=1;
		while(K>siz[p]) {
			K-=siz[p];
			for(i=0;i<26;i++) {
				if(K<=f[ch[p][i]]) {printf("%c",i+'a'),p=ch[p][i]; break;}
				else K-=f[ch[p][i]];
			}
		}
		puts("");
	}
}

 

 
posted @ 2018-06-07 21:57  fcwww  阅读(150)  评论(0编辑  收藏  举报