博客园 首页 私信博主 显示目录 隐藏目录 管理 动画

BZOJ.4598.[SDOI2016]模式字符串(点分治 Hash)

LOJ
BZOJ
洛谷


\(Description\)
给定一棵\(n\)个点的树,每个点上有一个字符。给一个长\(m\)的串\(S\),求有多少条路径循环匹配了给定串。循环匹配的串指形如\(SS...SS\)的串(\(S\)出现整数次)。
\(n,m\leq10^5,\ \sum n,m\leq10^6\)

\(Solution\)
点分治。考虑如何计算过\(rt\)的答案。
\(pre[i]\)表示(之前的)子树内循环匹配了\(S\)的前缀\(i\)的路径有多少,\(suf[i]\)表示(之前的)子树内循环匹配了\(S\)的后缀\(i\)的路径有多少。
一个点如果能作为前缀\(dep\%m\)出现,然后\(s[rt]=s[dep\%m+1]\),就可以统计\(suf[m-dep\%m-1]\)的贡献。
作为后缀出现同理。

判某个深度\(dep\)是否是循环匹配了\(S\)的前缀\(i\),本来想的是首先\(dep\sim dep-m+1\)匹配了整个\(S\),其次再判\(dep-m\)匹配了前缀\(i\)。其实只要先把\(S\)变成长度为\(n\)的循环串,再对它求\(Hash\)就可以惹。这样每次插入一个字符时在字符串开头插入,只需要判断\(hs_{now}==hs[dep]\)
判后缀就对应一下那个\(hs_{now}\)好了(每次在开头插入字符),即若出现了\(s[n-2],s[n-1],s[n]\),得到的Hash值是\(s[n],s[n-1],s[n-2]\)的,所以把串反过来求Hash值,判一下\(hs_{now}==hs'[dep]\)就好啦。

复杂度\(O(n\log n)\),这个数据范围应该卡不掉的叭?(应该。但是实际数据范围小惹?)

初始化\(1e6\)\(pow\)数组还不如每次初始化\(n\)的=-=
另外单组数据是\(3\leq n,m\leq 1e5\)的。


//9940kb	2808ms
#include <cstdio>
#include <cctype>
#include <cstring>
#include <algorithm>
#define seed 31
#define gc() getchar()
#define MAXIN 500000
//#define gc() (SS==TT&&(TT=(SS=IN)+fread(IN,1,MAXIN,stdin),SS==TT)?EOF:*SS++)
typedef long long LL;
typedef unsigned long long ull;
const int N=1e5+5;

int m,s[N],ch[N],Enum,H[N],nxt[N<<1],to[N<<1],Min,root,sz[N],pre[N],suf[N],spre[N],ssuf[N],Maxd;
LL Ans;
ull pw[N],hs[N],hs2[N];
bool vis[N];
char IN[MAXIN],*SS=IN,*TT=IN;

inline int read()
{
	int now=0;register char c=gc();
	for(;!isdigit(c);c=gc());
	for(;isdigit(c);now=now*10+c-48,c=gc());
	return now;
}
inline void AE(int u,int v)
{
	to[++Enum]=v, nxt[Enum]=H[u], H[u]=Enum;
	to[++Enum]=u, nxt[Enum]=H[v], H[v]=Enum;
}
inline void GetHash(ull *a,int *s,int n,int m)
{
	for(int i=m+1; i<=n; ++i) s[i]=s[i-m];
	for(int i=1; i<=n; ++i) a[i]=a[i-1]*seed+s[i];
}
void FindRoot(int x,int fa,int tot)
{
	int mx=0; sz[x]=1;
	for(int i=H[x],v; i; i=nxt[i])
		if(!vis[v=to[i]]&&v!=fa)
			FindRoot(v,x,tot), sz[x]+=sz[v], sz[v]>mx&&(mx=sz[v]);
	mx=std::max(mx,tot-mx);
	if(mx<Min) Min=mx, root=x;
}
void DFS(int x,int fa,int dep,ull val,const int Chrt)
{
	Maxd=std::max(Maxd,dep), val+=pw[dep-1]*ch[x];
	int tmp=dep%m;
	if(val==hs[dep]) ++pre[tmp], s[tmp+1]==Chrt&&(Ans+=ssuf[m-tmp-1]);
	if(val==hs2[dep]) ++suf[tmp], s[m-tmp]==Chrt&&(Ans+=spre[m-tmp-1]);
	for(int i=H[x],v; i; i=nxt[i])
		if(!vis[v=to[i]]&&v!=fa) DFS(v,x,dep+1,val,Chrt);
}
void Solve(int x)
{
	vis[x]=1; int mx=0; spre[0]=ssuf[0]=1;
//	spre[0]=ch[x]==s[1], ssuf[0]=ch[x]==s[m];//这个不需要判的叭。因为统计贡献时要求s[p]=ch[rt]。
	for(int i=H[x],v; i; i=nxt[i])
		if(!vis[v=to[i]])
		{
			Maxd=0, DFS(v,x,1,0,ch[x]), Maxd=std::min(Maxd,m-1), mx=std::max(mx,Maxd);
			for(int j=0,tmp=Maxd; j<=tmp; ++j) spre[j]+=pre[j], ssuf[j]+=suf[j], pre[j]=suf[j]=0;
		}
	for(int i=0; i<=mx; ++i) spre[i]=ssuf[i]=0;
	for(int i=H[x],v; i; i=nxt[i])
		if(!vis[v=to[i]]) Min=N, FindRoot(v,x,sz[v]), Solve(root);
}

int main()
{
	pw[0]=1;
	for(int T=read(),mx=0; T--; )
	{
		int n=read(),m=read(); ::m=m;
		Enum=0, memset(H,0,n+1<<2), memset(vis,0,n+1);
		if(mx<n)
		{
			for(int i=mx+1; i<=n; ++i) pw[i]=pw[i-1]*seed;
			mx=n;
		}
		register char c; while(!isalpha(c=gc())); ch[1]=c-65+1;
		for(int i=2; i<=n; ++i) ch[i]=gc()-65+1;
		for(int i=1; i<n; ++i) AE(read(),read());
		while(!isalpha(c=gc())); s[1]=c-65+1;
		for(int i=2; i<=m; ++i) s[i]=gc()-65+1;
		GetHash(hs,s,n,m), std::reverse(s+1,s+1+m), GetHash(hs2,s,n,m), std::reverse(s+1,s+1+m);
		Ans=0, Min=N, FindRoot(1,1,n), Solve(root), printf("%lld\n",Ans);
	}

	return 0;
}
posted @ 2019-04-13 11:15  SovietPower  阅读(169)  评论(0编辑  收藏  举报