CF1276F-Asterisk Substrings【SAM,线段树合并】

1|0正题

题目链接:https://www.luogu.com.cn/problem/CF1276F


1|1题目大意

给出一个长度为n的字符串S,现在依次进行如下操作

  1. 取出S的一个子串T
  2. T中的一个字符替换成号(也可以不替换)

求最后有多少种不同的T


1|2解题思路

发现最终其实只有4种情况,T,T,T,T1T2

前面三种很好记录,主要考虑最后一种。

对于T1来说,同一个endpos等价类中的子串对应的T2数量应该也是相同的。

那我们肯定是先建一个SAM这样就可以知道每个endpos等价类了。

那么考虑怎么统计T2的数量,其实对应i在某个endpos里,那么我们就只需要考虑从i+2这些位置开始的不同串的数量。

也就是确定起始位置的子串,这提醒我们反着再建立一个SAM,然后把所有i+2位置的点标记了,这些点和根在fail树上的虚树路径长度和就是我们要知道的答案。

那么怎么维护这个东西呢,我们在正着的SAM上每个点维护一个线段树,然后统计反着的SAM上的链并长度,这个显然是可以用线段树合并的。

时间复杂度:O(nlog2n)(如果肯写O(1)LCA的话可以做到O(nlogn)


1|3code

#include<cstdio> #include<cstring> #include<algorithm> #define ll long long using namespace std; const ll N=2e5+10,M=N<<5; struct SAM{ ll cnt,last,len[N],pos[N],fa[N],ch[N][26]; void Ins(ll c,ll id){ ll p=last,np=last=++cnt; len[np]=len[p]+1;pos[id]=np; for(;p&&!ch[p][c];p=fa[p])ch[p][c]=np; if(!p)fa[np]=1; else{ ll q=ch[p][c]; if(len[p]+1==len[q])fa[np]=q; else{ ll nq=++cnt;len[nq]=len[p]+1; memcpy(ch[nq],ch[q],sizeof(ch[nq])); fa[nq]=fa[q];fa[q]=fa[np]=nq; for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq; } } return; } }Suf,Pre; struct node{ ll to,next; }a[N]; ll n,m,tot,cnt,ls[N],siz[N],dep[N],rt[N]; ll dfn[N],rfn[N],son[N],top[N],ans=2; char s[N]; void addl(ll x,ll y){ a[++tot].to=y; a[tot].next=ls[x]; ls[x]=tot;return; } void dfs1(ll x){ siz[x]=1; for(ll i=ls[x];i;i=a[i].next){ ll y=a[i].to;dep[y]=dep[x]+1; dfs1(y);siz[x]+=siz[y]; if(siz[y]>siz[son[x]])son[x]=y; } return; } void dfs2(ll x){ dfn[++cnt]=x;rfn[x]=cnt; if(son[x]){ top[son[x]]=top[x]; dfs2(son[x]); } for(ll i=ls[x];i;i=a[i].next){ ll y=a[i].to; if(y==son[x])continue; top[y]=y;dfs2(y); } return; } ll LCA(ll x,ll y){ while(top[x]!=top[y]){ if(dep[top[x]]<dep[top[y]])swap(x,y); x=Suf.fa[top[x]]; } return (dep[x]<dep[y])?x:y; } struct SegTree{ ll cnt,ls[M],rs[M],w[M],pl[M],pr[M]; void Merge(ll x){ if(!ls[x]||!rs[x]){ ll p=ls[x]|rs[x]; w[x]=w[p];pl[x]=pl[p];pr[x]=pr[p]; } else{ w[x]=w[ls[x]]+w[rs[x]]-Suf.len[LCA(pr[ls[x]],pl[rs[x]])]; pl[x]=pl[ls[x]];pr[x]=pr[rs[x]]; } return; } void Change(ll &x,ll L,ll R,ll pos){ if(!x)x=++cnt; if(L==R){w[x]=Suf.len[dfn[L]];pl[x]=pr[x]=dfn[L];return;} ll mid=(L+R)>>1; if(pos<=mid)Change(ls[x],L,mid,pos); else Change(rs[x],mid+1,R,pos); Merge(x);return; } ll Merge(ll x,ll y,ll L,ll R){ if(!x||!y)return x|y; ll mid=(L+R)>>1; ls[x]=Merge(ls[x],ls[y],L,mid); rs[x]=Merge(rs[x],rs[y],mid+1,R); Merge(x);return x; } }T; void solve(ll x){ for(ll i=ls[x];i;i=a[i].next){ ll y=a[i].to; solve(y);rt[x]=T.Merge(rt[x],rt[y],1,cnt); } ans+=T.w[rt[x]]*(Pre.len[x]-Pre.len[Pre.fa[x]]); return; } signed main() { scanf("%s",s+1);n=strlen(s+1); Pre.last=Pre.cnt=Suf.last=Suf.cnt=1; for(ll i=n;i>1;i--)Suf.Ins(s[i]-'a',i); for(ll i=1;i<n;i++)Pre.Ins(s[i]-'a',i); for(ll i=1;i<=Pre.cnt;i++)ans+=Pre.len[i]-Pre.len[Pre.fa[i]]; for(ll i=1;i<=Suf.cnt;i++)ans+=Suf.len[i]-Suf.len[Suf.fa[i]]; Suf.Ins(s[1]-'a',1);Pre.Ins(s[n]-'a',n); for(ll i=2;i<=Suf.cnt;i++)addl(Suf.fa[i],i),ans+=Suf.len[i]-Suf.len[Suf.fa[i]]; dfs1(1);top[1]=1;dfs2(1); tot=0;memset(ls,0,sizeof(ls)); for(ll i=2;i<=Pre.cnt;i++)addl(Pre.fa[i],i); for(ll i=1;i<n-1;i++) T.Change(rt[Pre.pos[i]],1,cnt,rfn[Suf.pos[i+2]]); solve(1); printf("%lld\n",ans); return 0; }

__EOF__

本文作者QuantAsk
本文链接https://www.cnblogs.com/QuantAsk/p/16373515.html
关于博主:退役OIer,GD划水选手
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角推荐一下。您的鼓励是博主的最大动力!
posted @   QuantAsk  阅读(46)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 张高兴的大模型开发实战:(一)使用 Selenium 进行网页爬虫
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
点击右上角即可分享
微信分享提示