洛谷P4094 - [TJOI2016]字符串
Description
给出一个字符串\(s(|s|\leq10^5)\)和\(m\)次询问,每次询问子串\(s[x_1..x_2]\)的所有子串和\(s[y_1..y_2]\)的最长公共前缀长度的最大值。
Solution
后缀数组+二分答案+主席树。
易知\(s[x_1..x_2]\)的所有子串可以视为\(s[x_1..x_2]\)的所有后缀。那么可以得到:
\[ ans=max\{ min(lcp(i,y_1),x_2-i+1,y_2-y_1+1)\} \quad (i\in [x_1,x_2])$$ $lcp(i,j)$表示后缀$i$与后缀$j$的最长公共前缀长度。用后缀数组可以在$O(nm)$内搞定。
考虑二分答案$ans\in [0,min(x_2-i+1,y_2-y_1+1)]$,二分结果为$len$。由于$lcp(i,y_1)$相当于一段区间的最小值,那么$rnk[i]$离$rnk[y_1]$越远就越小。那么我们可以再次二分来找到一个区间$[fr,to]$,$\forall i\in [fr,to]$,有$lcp(sa[i],y_1)\geq len$。那么检查是否有$sa[i]\in [x_1,x_2-len+1]$,若有则说明$len$合法,扩大$len$;否则不合法,缩小$len$。
于是我们要做的就是求$sa$的某个区间内是否有某个数在某个范围内。对$sa$建立$n$棵线段树,第$i$棵的第$j$位为$1$表示在$sa[1..i]$中有$j$。询问时查询两棵线段树的差即可。
> 时间复杂度$O((n+m)logn)$。
##Code
```cpp
//[TJOI2016]字符串
#include <cstdio>
#include <cstring>
inline int read()
{
int x=0; char ch=getchar();
while(ch<'0'||'9'<ch) ch=getchar();
while('0'<=ch&&ch<='9') x=x*10+ch-'0',ch=getchar();
return x;
}
inline int min(int x,int y) {return x<y?x:y;}
inline int swap(int &x,int &y) {int t=x; x=y,y=t;}
const int N=1e5+10;
int n,m; char s[N];
int sa[N],rnk[N<<1],h[N];
int cnt[N],tmp[N],rnk1[N];
int lg2[N],st[N][18];
void getSA()
{
memset(cnt,0,sizeof cnt);
for(int i=1;i<=n;i++) cnt[s[i]]=1;
for(int i=1;i<=256;i++) cnt[i]+=cnt[i-1];
for(int i=1;i<=n;i++) rnk[i]=cnt[s[i]];
for(int L=1,k=0;k<n;L<<=1)
{
memset(cnt,0,sizeof cnt);
for(int i=1;i<=n;i++) cnt[rnk[i+L]]++;
for(int i=1;i<=n;i++) cnt[i]+=cnt[i-1];
for(int i=n;i>=1;i--) tmp[cnt[rnk[i+L]]--]=i;
memset(cnt,0,sizeof cnt);
for(int i=1;i<=n;i++) cnt[rnk[tmp[i]]]++;
for(int i=1;i<=n;i++) cnt[i]+=cnt[i-1];
for(int i=n;i>=1;i--) sa[cnt[rnk[tmp[i]]]--]=tmp[i];
k=0;
for(int i=1;i<=n;i++)
{
if(rnk[sa[i]]!=rnk[sa[i-1]]||rnk[sa[i]+L]!=rnk[sa[i-1]+L]) k++;
rnk1[sa[i]]=k;
}
memcpy(rnk,rnk1,sizeof rnk1);
}
for(int i=1,k=0;i<=n;i++)
{
if(rnk[i]==1) {h[1]=k=0; continue;}
if(k) k--;
while(s[i+k]==s[sa[rnk[i]-1]+k]) k++;
h[rnk[i]]=k;
}
lg2[1]=0; for(int i=2;i<=n;i++) lg2[i]=lg2[i>>1]+1;
for(int i=1;i<=n;i++) st[i][0]=h[i];
for(int k=1;(1<<k)<=n;k++)
for(int i=1;i+(1<<k)-1<=n;i++)
st[i][k]=min(st[i][k-1],st[i+(1<<k-1)][k-1]);
}
int lcp(int x,int y)
{
if(x==y) return n-x+1;
int i=rnk[x],j=rnk[y]; if(i>j) swap(i,j);
i++;
int t=lg2[j-i+1];
return min(st[i][t],st[j-(1<<t)+1][t]);
}
int ndCnt,rt[N];
struct node{int chL,chR; int cnt;} nd[N*18];
void update(int p) {nd[p].cnt=nd[nd[p].chL].cnt+nd[nd[p].chR].cnt;}
void ins(int &p,int L0,int R0,int x)
{
nd[++ndCnt]=nd[p]; p=ndCnt;
if(L0==R0) {nd[p].cnt++; return;}
int mid=L0+R0>>1;
if(x<=mid) ins(nd[p].chL,L0,mid,x);
else ins(nd[p].chR,mid+1,R0,x);
update(p);
}
int optL,optR;
int qres;
void query(int p1,int p2,int L0,int R0)
{
if(p1==p2) return;
if(optL<=L0&&R0<=optR) {qres+=nd[p2].cnt-nd[p1].cnt; return;}
int mid=L0+R0>>1;
if(optL<=mid) query(nd[p1].chL,nd[p2].chL,L0,mid);
if(mid<optR) query(nd[p1].chR,nd[p2].chR,mid+1,R0);
}
int x1,x2,y1,y2;
bool check(int len)
{
int fr=1,fr1=rnk[y1];
while(fr<=fr1)
{
int mid=fr+fr1>>1;
if(lcp(sa[mid],y1)<len) fr=mid+1;
else fr1=mid-1;
}
int to=rnk[y1],to1=n;
while(to<=to1)
{
int mid=to+to1>>1;
if(lcp(y1,sa[mid])<len) to1=mid-1;
else to=mid+1;
}
to--;
optL=x1,optR=x2-len+1,qres=0; query(rt[fr-1],rt[to],1,n);
return qres>0;
}
int main()
{
n=read(),m=read(); scanf("%s",s+1);
getSA();
for(int i=1;i<=n;i++) ins(rt[i]=rt[i-1],1,n,sa[i]);
for(int i=1;i<=m;i++)
{
x1=read(),x2=read(),y1=read(),y2=read();
int L=1,R=min(x2-x1+1,y2-y1+1);
while(L<=R)
{
int mid=L+R>>1;
if(check(mid)) L=mid+1;
else R=mid-1;
}
printf("%d\n",R);
}
return 0;
}
```\]