【BZOJ-1396&2865】识别子串&字符串识别 后缀自动机/后缀树组 + 线段树
1396: 识别子串
Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 312 Solved: 193
[Submit][Status][Discuss]
Description
Input
Output
Sample Input
Sample Output
2
3
3
2
2
3
3
2
2
3
3
2
1
2
3
3
2
1
2
3
4
HINT
Source
Solution
BZOJ:1396
这题使用 后缀自动机+线段树 的做法;
首先按照这道题的要求,所有的识别子串一定是$|Right|=1$的节点所代表的子串之一,问题在于统计最短。
这样可以考虑再记录每个$Right$集合的最后一个$endpos$,然后利用这个去考虑对原串每个位置的贡献。
对于$[endpos-maxlen+1,endpos-minlen+1]$中的每个位置$x$,贡献就是$endpos-x+1$;
理解起来就是对于$[endpos-maxlen+1,endpos-minlen+1]$中的每个子串都是单独存在的,所以这个$Right$集合贡献给他的答案就是这个点到$endpos$的长度。
对于$[endpos-minlen,endpos]$中的每个位置$x$,贡献就是$minlen$;
理解起来就是对于$[endpos-minlen,endpos]$中的每个子串显然是存在多个结束位置的,所以当前这个$Right$集合能够贡献给他的符合只出现一次且最短的,就是刚好跨过它的最小,即$minlen$。
这样对于两种情况,分别用线段树去维护,至于第一种情况的$-x$是定值,所以拿到外面比较的时候再算进答案即可。
BZOJ2865
这道题和上道题完全一样,不过数据范围扩大了,需要卡内存...用上了map内存还是多10M...于是直接写 后缀树组+线段树 的做法了。
和刚刚的想法类似。
考虑固定左端点$l$,对后面的影响。
容易发现,固定了$l$之后,对后面的答案,存在两种影响。
设这样两种情况的分界点为$m$
对于第一种影响$[l,m]$贡献的答案就是$lcp+1$,而第二种$[m+1,N]$的每个位置$x$贡献答案就是$x-l+1$
所以这样可以枚举$sa_{i}$,对于$sa_{i}$它的$lcp+1$实际上就是与它相邻的两个后缀的$height_{max}+1$,那么分界点$m$恰好是$sa_{i}+lcp$.
理解起来就是对于它的$lcp$显然是重复出现过的,那么这段的答案最短就是$lcp+1$,而对于这段之后的位置的影响,显然就是 那个位置到当前位置$sa_{i}$的距离长度的串 最短。
用同样的方法用两棵线段树维护.
Code
BZOJ1396
#include<iostream> #include<cstdio> #include<algorithm> #include<cstring> #include<cmath> using namespace std; #define MAXN 100010 #define INF 0x7fffffff char S[MAXN]; int N; namespace SegmentTree{ #define lson now<<1 #define rson now<<1|1 struct SgtNode{ int l,r,minn,tag; }; struct SegmentTree{ SgtNode tree[MAXN<<2]; inline void Update(int now) {tree[now].minn=min(tree[lson].minn,tree[rson].minn);} inline void Build(int now,int l,int r) { tree[now].tag=tree[now].minn=INF; tree[now].l=l,tree[now].r=r; if (l==r) return; int mid=(l+r)>>1; Build(lson,l,mid); Build(rson,mid+1,r); } inline void Pushdown(int now) { if (tree[now].l==tree[now].r || tree[now].tag==INF) return; int val=tree[now].tag; tree[now].tag=INF; tree[lson].minn=min(tree[lson].minn,val); tree[rson].minn=min(tree[rson].minn,val); tree[lson].tag=min(tree[lson].tag,val); tree[rson].tag=min(tree[rson].tag,val); } inline void Modify(int now,int L,int R,int val) { if (L>R) return; int l=tree[now].l,r=tree[now].r; Pushdown(now); if (L<=l && R>=r) { tree[now].tag=min(tree[now].tag,val); tree[now].minn=min(tree[now].minn,val); return; } int mid=(l+r)>>1; if (L<=mid) Modify(lson,L,R,val); if (R>mid) Modify(rson,L,R,val); Update(now); } inline int Query(int now,int pos) { int l=tree[now].l,r=tree[now].r; Pushdown(now); if (l==r) return tree[now].minn; int mid=(l+r)>>1; if (pos<=mid) return Query(lson,pos); else return Query(rson,pos); } }t1,t2; }using namespace SegmentTree; namespace SAM{ int son[MAXN<<1][27],len[MAXN<<1],par[MAXN<<1],endpos[MAXN<<1],size[MAXN<<1]; int last,root,sz; inline void init() {last=root=++sz;} inline void Extend(int c,int pos) { int cur=++sz,p=last; len[cur]=len[p]+1; endpos[cur]=pos; size[cur]=1; while (p && !son[p][c]) son[p][c]=cur,p=par[p]; if (!p) par[cur]=root; else { int q=son[p][c]; if (len[p]+1==len[q]) par[cur]=q; else { int nq=++sz; memcpy(son[nq],son[q],sizeof(son[nq])); len[nq]=len[p]+1; par[nq]=par[q]; while (p && son[p][c]==q) son[p][c]=nq,p=par[p]; par[q]=par[cur]=nq; } } last=cur; } inline void Build() {init(); for (int i=1; i<=N; i++) Extend(S[i]-'a'+1,i);} int st[MAXN],id[MAXN<<1]; inline void Prework() { for (int i=1; i<=sz; i++) st[len[i]]++; for (int i=1; i<=N; i++) st[i]+=st[i-1]; for (int i=1; i<=sz; i++) id[st[len[i]]--]=i; for (int i=sz; i>=1; i--) { int x=id[i]; size[par[x]]+=size[x]; endpos[par[x]]=max(endpos[par[x]],endpos[x]); } } inline void Work() { for (int i=1; i<=sz; i++) if (size[i]==1) { int maxlen=len[i],minlen=len[par[i]]+1,end=endpos[i]; // printf("%d %d %d\n",end,maxlen,minlen); t1.Modify(1,end-maxlen+1,end-minlen+1,end+1); t2.Modify(1,end-minlen+1,end,minlen); } for (int i=1; i<=N; i++) { int x=t1.Query(1,i)-i,y=t2.Query(1,i); printf("%d\n",min(x,y)); } } }using namespace SAM; int main() { scanf("%s",S+1); N=strlen(S+1); t1.Build(1,1,N),t2.Build(1,1,N); SAM::Build(); SAM::Prework(); SAM::Work(); return 0; }
BZOJ2865
#include<iostream> #include<cmath> #include<cstring> #include<algorithm> #include<cstdio> using namespace std; #define MAXN 500010 char S[MAXN]; int N; #define INF 0x3fffffff namespace SegmentTree{ #define lson now<<1 #define rson now<<1|1 struct SgtNode{ int l,r,minn,tag; }; struct SegmentTree{ SgtNode tree[MAXN<<2]; inline void Update(int now) {tree[now].minn=min(tree[lson].minn,tree[rson].minn);} inline void Build(int now,int l,int r) { tree[now].tag=tree[now].minn=INF; tree[now].l=l,tree[now].r=r; if (l==r) return; int mid=(l+r)>>1; Build(lson,l,mid); Build(rson,mid+1,r); } inline void Pushdown(int now) { if (tree[now].l==tree[now].r || tree[now].tag==INF) return; int val=tree[now].tag; tree[now].tag=INF; tree[lson].minn=min(tree[lson].minn,val); tree[rson].minn=min(tree[rson].minn,val); tree[lson].tag=min(tree[lson].tag,val); tree[rson].tag=min(tree[rson].tag,val); } inline void Modify(int now,int L,int R,int val) { if (L>R) return; int l=tree[now].l,r=tree[now].r; Pushdown(now); if (L<=l && R>=r) { tree[now].tag=min(tree[now].tag,val); tree[now].minn=min(tree[now].minn,val); return; } int mid=(l+r)>>1; if (L<=mid) Modify(lson,L,R,val); if (R>mid) Modify(rson,L,R,val); Update(now); } inline int Query(int now,int pos) { int l=tree[now].l,r=tree[now].r; Pushdown(now); if (l==r) return tree[now].minn; int mid=(l+r)>>1; if (pos<=mid) return Query(lson,pos); else return Query(rson,pos); } }t1,t2; }using namespace SegmentTree; namespace SA{ int r[MAXN],sa[MAXN],rank[MAXN],height[MAXN],st[MAXN],tx[MAXN],ty[MAXN]; inline void Sort(int *x,int *y,int *sa,int L,int M) { for (int i=0; i<=M; i++) st[i]=0; for (int i=0; i<L; i++) st[x[y[i]]]++; for (int i=1; i<=M; i++) st[i]+=st[i-1]; for (int i=L-1; i>=0; i--) sa[--st[x[y[i]]]]=y[i]; } inline void DA(int *r,int *sa,int L,int M) { int *x=tx,*y=ty,*t,i,j,p; for (int i=0; i<L; i++) x[i]=r[i],y[i]=i; Sort(x,y,sa,L,M); for (j=1,p=1; j<L && p<L; j<<=1,M=p-1) { for (p=0,i=L-j; i<L; i++) y[p++]=i; for (i=0; i<=L; i++) if (sa[i]>=j) y[p++]=sa[i]-j; Sort(x,y,sa,L,M); for (t=x,x=y,y=t,x[sa[0]]=0,i=1,p=1; i<L; i++) x[sa[i]]=y[sa[i]]==y[sa[i-1]] && y[sa[i]+j]==y[sa[i-1]+j]? p-1:p++; } } inline void Height(int *r,int *sa,int *rank,int *h,int L) { h[1]=0; for (int i=1; i<=L; i++) rank[sa[i]]=i; for (int i=1,j,k=0; i<=L; h[rank[i++]]=k) for (k? k--:k=0,j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++); } }using namespace SA; int main() { scanf("%s",S+1); N=strlen(S+1); for (int i=1; i<=N; i++) r[i]=S[i]-'a'+1; SA::DA(r,sa,N+1,27); SA::Height(r,sa,rank,height,N); // for (int i=1; i<=N; i++) printf("%d ",sa[i]); puts(""); // for (int i=1; i<=N; i++) printf("%d ",height[i]); puts(""); t1.Build(1,1,N); t2.Build(1,1,N); for (int i=1; i<=N; i++) { int j=max(height[i],height[i+1])+1; if (j+sa[i]-1<=N) t1.Modify(1,sa[i],sa[i]+j-1,j); t2.Modify(1,sa[i]+j,N,1-sa[i]); // printf("%d %d %d %d\n",i,j,sa[i],j+sa[i]); } for (int i=1; i<=N; i++) { int x=t1.Query(1,i),y=t2.Query(1,i)+i; printf("%d\n",min(x,y)); } return 0; }
自己断断续续想了好久才想到...真的是弱的没救了....