LOJ_#2720. 「NOI2018」你的名字 _后缀数组+主席树+倍增

题面:

 https://loj.ac/problem/2720


 

考虑枚举T串的每个后缀i,我们要做两件事。

一、统计有多少子串[i,j]在S中要求位置出现。

二、去重。

第二步好做,相当于在后缀数组上找到后继,假设后继的height为p。

那对于i这个后缀,只计算i+p后面的即可。

一的话每次找到最远的能匹配的一个位置,可以发现枚举每个后缀时右端点单调,双指针扫一下。

剩下的就是快速的判定一个子串是否合法。

考虑在后缀数组上左右二分到一个区间满足所有后缀和i的lcp都大于等于len(len=j-i+1)。

判断这段区间是否存在一个位置,刚好在S中[l,r-len+1]的位置上。主席树直接做。

重复一下做法:

对所有的串建立后缀数组,同时求出height。

在所有S串的地方主席树上更新。

双指针扫一遍,check的时候左右二分找区间,主席树上查即可。

 

这里补充一个技巧...因为区间可能不会很长,所以用倍增会比直接二分快很多....

 

代码:

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cstdlib>
using namespace std;
#define N 1700000
#define M 100050
#define _max(x,y) ((x)>(y)?(x):(y))
#define _min(x,y) ((x)<(y)?(x):(y))
typedef long long ll;
int n,Q,r[N],ln,be[M],ed[M],m;
int wa[N],wb[N],ws[N],wv[N],sa[N],Rank[N],height[N],ql[M],qr[M],ppp[N],pos[N],lst[M];
int f[22][N],Lg[N],t[N*10],ls[N*10],rs[N*10],root[N],cnt;
inline char nc() {
	static char buf[100000],*p1,*p2;
	return p1==p2&&(p2=(p1=buf)+fread(buf,1,100000,stdin),p1==p2)?EOF:*p1++;
}
int rd() {
	int x=0; char s=nc();
	while(s<'0'||s>'9') s=nc();
	while(s>='0'&&s<='9') x=(x<<3)+(x<<1)+s-'0',s=nc();
	return x;
}
char pbuf[100000],*pp=pbuf;
void push(const char c) {
    if(pp-pbuf==100000) fwrite(pbuf,1,100000,stdout),pp=pbuf;
    *pp++=c;
}
void write(ll x) {
    static int sta[70];
    int top=0;
    do{sta[top++]=x%10,x/=10;}while(x);
    while(top) push(sta[--top]+'0');
}
void build_suffix_array() {
	int i,j,p,*x=wa,*y=wb,*t;
	m=32;
	for(i=0;i<m;i++) ws[i]=0;
    for(i=0;i<n;i++) ws[x[i]=r[i]]++;
    for(i=1;i<m;i++) ws[i]+=ws[i-1];
    for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
    for(p=j=1;p<n;j<<=1,m=p) {
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]-j>=0) y[p++]=sa[i]-j;
        for(i=0;i<n;i++) wv[i]=x[y[i]];
        for(i=0;i<m;i++) ws[i]=0;
        for(i=0;i<n;i++) ws[wv[i]]++;
        for(i=1;i<m;i++) ws[i]+=ws[i-1];
        for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
        for(t=x,x=y,y=t,i=p=1,x[sa[0]]=0;i<n;i++) {
            if(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+j]==y[sa[i-1]+j]) x[sa[i]]=p-1;
            else x[sa[i]]=p++;
        }
    }
	for(i=1;i<n;i++) Rank[sa[i]]=i;
    for(i=p=0;i<n-1;height[Rank[i++]]=p)
        for(p?p--:0,j=sa[Rank[i]-1];r[i+p]==r[j+p];p++);
	for(Lg[0]=-1,i=1;i<n;i++) f[0][i]=height[i],Lg[i]=Lg[i>>1]+1;
	for(i=1;(1<<i)<=n;i++) {
		for(j=1;j+(1<<i)-1<n;j++) {
			f[i][j]=min(f[i-1][j],f[i-1][j+(1<<(i-1))]);
		}
	}
}
int get_min(int x,int y) {
	int len=Lg[y-x+1],a=f[len][x],b=f[len][y-(1<<len)+1];
	return _min(a,b);
}
int lcp(int x,int y) {
	x=Rank[x],y=Rank[y];
	if(x>y) swap(x,y);
	return get_min(x+1,y);
}
void insert(int l,int r,int v,int x,int &y) {
	y=++cnt; t[y]=t[x]+1;
	if(l==r) return ;
	int mid=(l+r)>>1;
	if(v<=mid) rs[y]=rs[x],insert(l,mid,v,ls[x],ls[y]);
	else ls[y]=ls[x],insert(mid+1,r,v,rs[x],rs[y]);
}
int Qx,Qy,ok;
void query(int l,int r,int x,int y) {
	if(t[x]==t[y]||ok) return ;
	if(Qx<=l&&Qy>=r) {ok=1; return ;}
	int mid=(l+r)>>1;
	if(Qx<=mid) query(l,mid,ls[x],ls[y]);
	if(Qy>mid) query(mid+1,r,rs[x],rs[y]);
}
bool check(int i,int j,int q) {
	int len=j-i+1; Qx=ql[q],Qy=qr[q];
	if(len>Qy-Qx+1) return 0;
	int p=Rank[i];
	int L=p,R=p,d;
	for(d=1;p>d&&get_min(p-d+1,p)>=len;d<<=1);
	for(d>>=1;d;d>>=1) if(get_min(L-d+1,p)>=len) L-=d;
	for(d=1;p+d<n&&get_min(p+1,p+d)>=len;d<<=1);
	for(d>>=1;d;d>>=1) if(get_min(p+1,R+d)>=len) R+=d;
	Qy=Qy-len+1;
	ok=0;
	query(0,ln-1,root[L-1],root[R]);
	return ok;
}
int main() {
	char s=nc();
	while(s<'a'||s>'z') s=nc();
	register int i,j;
	for(;s>='a'&&s<='z';s=nc()) {
		r[ln++]=s-'a'+1;
	}
	n=ln; r[n++]=27;
	Q=rd();
	for(i=1;i<=Q;i++) {
		be[i]=n;
		s=nc();
		while(s<'a'||s>'z') s=nc();
		for(;s>='a'&&s<='z';s=nc()) {
			pos[n]=i; r[n++]=s-'a'+1;
		}
		ed[i]=n-1;
		ql[i]=rd()-1; qr[i]=rd()-1;
		if(i!=Q) r[n++]=27;
	}
	r[n++]=0;
	build_suffix_array();
	for(i=n-1;i>0;i--) {
		int p=sa[i],u=pos[p];
		if(!u) continue;
		if(lst[u]) ppp[p]=lcp(p,lst[u]);
		lst[u]=p;
	}
	for(i=1;i<n;i++) {
		int p=sa[i];
		root[i]=root[i-1];
		if(p>=0&&p<ln) insert(0,ln-1,p,root[i],root[i]);
	}
	for(i=1;i<=Q;i++) {
		ll ans=0;
		int k=be[i];
		for(j=be[i];j<=ed[i];j++) {
			if(k<j) k=j;
			while(k<=ed[i]&&check(j,k,i)) k++;
			k--;
			ans+=ed[i]-j+1-_max(k-j+1,ppp[j]);
		}
		write(ans); push('\n');
	}
	fwrite(pbuf,1,pp-pbuf,stdout);
}

 

posted @ 2018-08-05 19:25  fcwww  阅读(891)  评论(0编辑  收藏  举报