BZOJ.4598.[SDOI2016]模式字符串(点分治 Hash)
\(Description\)
给定一棵\(n\)个点的树,每个点上有一个字符。给一个长\(m\)的串\(S\),求有多少条路径循环匹配了给定串。循环匹配的串指形如\(SS...SS\)的串(\(S\)出现整数次)。
\(n,m\leq10^5,\ \sum n,m\leq10^6\)。
\(Solution\)
点分治。考虑如何计算过\(rt\)的答案。
记\(pre[i]\)表示(之前的)子树内循环匹配了\(S\)的前缀\(i\)的路径有多少,\(suf[i]\)表示(之前的)子树内循环匹配了\(S\)的后缀\(i\)的路径有多少。
一个点如果能作为前缀\(dep\%m\)出现,然后\(s[rt]=s[dep\%m+1]\),就可以统计\(suf[m-dep\%m-1]\)的贡献。
作为后缀出现同理。
判某个深度\(dep\)是否是循环匹配了\(S\)的前缀\(i\),本来想的是首先\(dep\sim dep-m+1\)匹配了整个\(S\),其次再判\(dep-m\)匹配了前缀\(i\)。其实只要先把\(S\)变成长度为\(n\)的循环串,再对它求\(Hash\)就可以惹。这样每次插入一个字符时在字符串开头插入,只需要判断\(hs_{now}==hs[dep]\)。
判后缀就对应一下那个\(hs_{now}\)好了(每次在开头插入字符),即若出现了\(s[n-2],s[n-1],s[n]\),得到的Hash值是\(s[n],s[n-1],s[n-2]\)的,所以把串反过来求Hash值,判一下\(hs_{now}==hs'[dep]\)就好啦。
复杂度\(O(n\log n)\),这个数据范围应该卡不掉的叭?(应该。但是实际数据范围小惹?)
初始化\(1e6\)的\(pow\)数组还不如每次初始化\(n\)的=-=
另外单组数据是\(3\leq n,m\leq 1e5\)的。
//9940kb 2808ms
#include <cstdio>
#include <cctype>
#include <cstring>
#include <algorithm>
#define seed 31
#define gc() getchar()
#define MAXIN 500000
//#define gc() (SS==TT&&(TT=(SS=IN)+fread(IN,1,MAXIN,stdin),SS==TT)?EOF:*SS++)
typedef long long LL;
typedef unsigned long long ull;
const int N=1e5+5;
int m,s[N],ch[N],Enum,H[N],nxt[N<<1],to[N<<1],Min,root,sz[N],pre[N],suf[N],spre[N],ssuf[N],Maxd;
LL Ans;
ull pw[N],hs[N],hs2[N];
bool vis[N];
char IN[MAXIN],*SS=IN,*TT=IN;
inline int read()
{
int now=0;register char c=gc();
for(;!isdigit(c);c=gc());
for(;isdigit(c);now=now*10+c-48,c=gc());
return now;
}
inline void AE(int u,int v)
{
to[++Enum]=v, nxt[Enum]=H[u], H[u]=Enum;
to[++Enum]=u, nxt[Enum]=H[v], H[v]=Enum;
}
inline void GetHash(ull *a,int *s,int n,int m)
{
for(int i=m+1; i<=n; ++i) s[i]=s[i-m];
for(int i=1; i<=n; ++i) a[i]=a[i-1]*seed+s[i];
}
void FindRoot(int x,int fa,int tot)
{
int mx=0; sz[x]=1;
for(int i=H[x],v; i; i=nxt[i])
if(!vis[v=to[i]]&&v!=fa)
FindRoot(v,x,tot), sz[x]+=sz[v], sz[v]>mx&&(mx=sz[v]);
mx=std::max(mx,tot-mx);
if(mx<Min) Min=mx, root=x;
}
void DFS(int x,int fa,int dep,ull val,const int Chrt)
{
Maxd=std::max(Maxd,dep), val+=pw[dep-1]*ch[x];
int tmp=dep%m;
if(val==hs[dep]) ++pre[tmp], s[tmp+1]==Chrt&&(Ans+=ssuf[m-tmp-1]);
if(val==hs2[dep]) ++suf[tmp], s[m-tmp]==Chrt&&(Ans+=spre[m-tmp-1]);
for(int i=H[x],v; i; i=nxt[i])
if(!vis[v=to[i]]&&v!=fa) DFS(v,x,dep+1,val,Chrt);
}
void Solve(int x)
{
vis[x]=1; int mx=0; spre[0]=ssuf[0]=1;
// spre[0]=ch[x]==s[1], ssuf[0]=ch[x]==s[m];//这个不需要判的叭。因为统计贡献时要求s[p]=ch[rt]。
for(int i=H[x],v; i; i=nxt[i])
if(!vis[v=to[i]])
{
Maxd=0, DFS(v,x,1,0,ch[x]), Maxd=std::min(Maxd,m-1), mx=std::max(mx,Maxd);
for(int j=0,tmp=Maxd; j<=tmp; ++j) spre[j]+=pre[j], ssuf[j]+=suf[j], pre[j]=suf[j]=0;
}
for(int i=0; i<=mx; ++i) spre[i]=ssuf[i]=0;
for(int i=H[x],v; i; i=nxt[i])
if(!vis[v=to[i]]) Min=N, FindRoot(v,x,sz[v]), Solve(root);
}
int main()
{
pw[0]=1;
for(int T=read(),mx=0; T--; )
{
int n=read(),m=read(); ::m=m;
Enum=0, memset(H,0,n+1<<2), memset(vis,0,n+1);
if(mx<n)
{
for(int i=mx+1; i<=n; ++i) pw[i]=pw[i-1]*seed;
mx=n;
}
register char c; while(!isalpha(c=gc())); ch[1]=c-65+1;
for(int i=2; i<=n; ++i) ch[i]=gc()-65+1;
for(int i=1; i<n; ++i) AE(read(),read());
while(!isalpha(c=gc())); s[1]=c-65+1;
for(int i=2; i<=m; ++i) s[i]=gc()-65+1;
GetHash(hs,s,n,m), std::reverse(s+1,s+1+m), GetHash(hs2,s,n,m), std::reverse(s+1,s+1+m);
Ans=0, Min=N, FindRoot(1,1,n), Solve(root), printf("%lld\n",Ans);
}
return 0;
}
很久以前的奇怪但现在依旧成立的签名
attack is our red sun $$\color{red}{\boxed{\color{red}{attack\ is\ our\ red\ sun}}}$$ ------------------------------------------------------------------------------------------------------------------------