【题解】[HEOI2016/TJOI2016]字符串
\(\text{Solution:}\)
记录一下这题获得的启发。
- 最长公共前缀/后缀一类问题,具有可二分性。
考虑二分一个答案,然后看如何检验。
如果答案是 \(mid,\) 那么对应的串应该就是 \(s[c\cdots c+mid-1],\) 我们发现:它是前缀 \(s[1\cdots c+mid-1]\) 的后缀。
- 通过前缀把子串转化成后缀
假定我们找到了一个点,它代表的串包含了 \(s[c\cdots c+mid-1],\) 如何查看是不是满足有一个 \(s[a\cdots b]\) 的子串是其前缀呢?
我们发现:它是区间内的 所有子串,也就是说,只要出现过即可。
那么就自然想到用 endpos 来判断。
考虑一下,当前答案是 \(mid,\) 如果要满足,其结束位置至少应该在 \(a+mid-1.\) 也就是说,我们需要查询这个点的 endpos 是否包含了区间 \([a+mid-1,b]\) 中的一个点。
这就需要线段树维护 endpos 的 trick 了。
接下来思考如何定位节点。考虑我们的 parent 树实际上是一棵 前缀树 ,它满足:每一条叶节点到根的路径对应一个前缀,同时,每一个非叶子节点到根的路径都对应了某前缀的后缀。
也就是说,我们定位到一个点后,向上跳父亲,实际就是在不断找后缀的过程。
那么我们前文所述,把它看成了前缀 \(s[1\cdots c+mid-1]\) 的后缀,于是我们思考,如何定位一个前缀?
这简单,从根开始依次匹配,匹配到的点对应的前缀就是答案。
那怎么往上跳定位呢?考虑经典技巧:倍增 。
考虑如何判断是不是跳到了对应节点:它一定满足,自身的 \(len\ge mid,\) 其父亲的 \(len<mid.\) 而 \(len\) 自下向上又具有单调性。
考虑倍增跳父亲即可。剩下的就是线段树上查询了。复杂度 \(O(n\log^2 n).\)
#include<bits/stdc++.h>
using namespace std;
const int N=4e6+10;
const int SN=2e5+10;
int n,m;
char s[SN];
int sufpos[SN];
inline int Min(int x,int y){return x<y?x:y;}
inline int Max(int x,int y){return x>y?x:y;}
namespace SGT{
int ls[N],rs[N],node;
void change(int &x,const int &L,const int &R,const int &pos){
if(!x)x=++node;
if(L==R)return;
int mid=(L+R)>>1;
if(pos<=mid)change(ls[x],L,mid,pos);
else change(rs[x],mid+1,R,pos);
}
int merge(const int &x,const int &y){
if(!x||!y)return x|y;
int p=++node;
ls[p]=merge(ls[x],ls[y]);
rs[p]=merge(rs[x],rs[y]);
return p;
}
bool query(const int &x,const int &L,const int &R,const int &l,const int &r){
if(!x)return 0;
if(L>=l&&R<=r)return 1;
int mid=(L+R)>>1;
int res=0;
if(l<=mid)res=query(ls[x],L,mid,l,r);
if(mid<r)res|=query(rs[x],mid+1,R,l,r);
return res;
}
}
using namespace SGT;
namespace SAM{
int len[SN],ch[SN][26],pa[SN],rt[SN],last=1,tot=1;
vector<int>G[N];
int f[N][21];
void insert(const int &c){
int p=last;
int np=++tot;
last=tot;len[np]=len[p]+1;
for(;p&&!ch[p][c];p=pa[p])ch[p][c]=np;
if(!p)pa[np]=1;
else{
int q=ch[p][c];
if(len[q]==len[p]+1)pa[np]=q;
else{
int nq=++tot;
len[nq]=len[p]+1;
memcpy(ch[nq],ch[q],sizeof ch[q]);
pa[nq]=pa[q];pa[q]=pa[np]=nq;
for(;p&&ch[p][c]==q;p=pa[p])ch[p][c]=nq;
}
}
}
void dfs(int x){
for(auto v:G[x]){
f[v][0]=x;
for(int i=1;i<21;++i)f[v][i]=f[f[v][i-1]][i-1];
dfs(v);
rt[x]=merge(rt[x],rt[v]);
}
}
void Build(){
for(int i=2;i<=tot;++i)G[pa[i]].push_back(i);
dfs(1);
}
}
using namespace SAM;
bool check(int mid,int a,int b,int c){
//endpos in [a+mid-1,b]
//Let us find the position of c.
int posc=sufpos[c+mid-1];
//the sequence is [c,c+mid-1]
for(int i=20;~i;--i)if(len[f[posc][i]]>=mid)posc=f[posc][i];
return query(rt[posc],1,n,a+mid-1,b);
}
int main(){
scanf("%d%d",&n,&m);
scanf("%s",s+1);
for(int i=1;i<=n;++i)insert(s[i]-'a');
for(int i=1,now=1;i<=n;++i){
int v=s[i]-'a';
now=ch[now][v];
sufpos[i]=now;
change(rt[now],1,n,i);
}
Build();
while(m--){
int a,b,c,d;
scanf("%d%d%d%d",&a,&b,&c,&d);
int len1=b-a+1;
int len2=d-c+1;
int l=1,r=Min(len1,len2);
int Ans=-1;
while(l<=r){
int mid=(l+r)>>1;
if(check(mid,a,b,c))l=mid+1,Ans=mid;
else r=mid-1;
}
printf("%d\n",Ans);
}
return 0;
}