BZOJ2434[NOI2011]阿狸的打字机

知识点:

AC自动机,fail树,离线,树状数组,主席树

题意:

给定若干个串,若干次询问(x,y)x串在y串中出现了多少次,除了值域(小写字母)外范围都是1e5.

解法:

首先,按照它给定的“打字机读入方式”,我们可以在trie上跳,模拟这一个过程。遇到小写字母,则往下跳(没有就插入新点),遇到\(B\)就跳回其父亲处(所以trie还要维护每个点父亲点的编号),遇到\(P\)就标记一下结尾的节点(假如原来有点,那么就把当前串的fa定为原来的那个串,否则新增一个编号)。假如不按上面这种方法来的话,复杂度上界是\(O(n^2)\)的。

接下来,考虑单个的(x,y)怎么匹配。注意题目问的是x在y中出现了多少次,我们要明确几个性质。

  • 一个ACAM上的节点到根节点上的路径,每一个路径上的点都是当前点的前缀。这个用trie来理解就非常显然了。
  • 一个fail树上的节点到根节点上的路径,每一个路径上的点都是当前点的后缀,且一定是长度依次单调递减的一个后缀。

这里补充一下什么就做fail树,fail树就是把fail指针反向连接起来形成的一棵树,具有很多很优美的性质。

那么我们通过以上两个性质,我们可以发现,问x在y中出现的次数,就是问x在fail树的子树中有多少个点是y节点在fail树中所对应节点的祖先(包括y自己)。

所以我们考虑怎么维护上面的那个信息。

假如在线做,那么每次遍历一次fail树,是\(O(n^2)\)的,所以我们必须把所有询问离线下来,因为是问y作为文本串的,所以可以选择把y排序处理。不过这里我选择开个vector直接把y对应的fa(就是在插入时,相同的话就记的那个fa)对应的ACAM上的编号挂上去,把x也同样处理后挂上去。

考虑把fail树的DFS序弄出来(因为以某个节点为根的子树一定是在DFS序上连续的一段),所以可以转化为序列上的问题用树状数组等数据结构来维护。因为每次进入走出某个节点发生的影响都是1,所以DFS一遍trie树(注意这里要在求fail之前把所有的son备份一遍,否则会连到一些原来没有的点上),一到一个点就把当前点在fail树上的DFS序所对应的点在树状数组上+1,然后回答当前点的所有询问(均为x点的子树右端点-x点的子树左端点对于的值),然后遍历所有的真儿子,然后-1走人。

注意:

  1. 搞清楚什么时候是fail,什么时候是trie。这里理解子串个人认为可以类比SAM,因为一个子串=后缀的前缀=前缀的后缀,所以是遍历trie树,但是树状数组维护的DFS序是在fail树上的。
  2. 假如你在想,为什么不是加上一个地方的所有的子串结尾的个数,而是+1?是因为题目问的是x在y中出现的次数,就算出现很多次,那也只算一次。

代码:

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<queue>
#include<vector>
using namespace std;

const int maxn=100010;
int n,m,head[maxn],etot,tot=1,c[maxn],dfn[maxn],low[maxn],fa[maxn],cnt,ans[maxn],id[maxn];
struct node
{
	int nxt,to;
}edge[maxn];
struct trie
{
	int son[26],fail,tag,fa,ch[26];
}a[maxn];
struct pro
{
	int x,id;
};
vector<pro>que[maxn];
queue<int>q;
char s[maxn];

int read()
{
	int x=0;
	char c=getchar();
	while (c<48||c>57)
		c=getchar();
	while (c>=48&&c<=57)
		x=(x<<1)+(x<<3)+(c^48),c=getchar();
	return x;
}

void insert(char *s)
{
	int i,u=1,len=strlen(s),k;
	a[1].fa=1;
	for (i=0;i<len;i++)
	{
		if (s[i]>='a'&&s[i]<='z')
		{
			k=s[i]-'a';
			if (!a[u].son[k])
			{
				a[u].son[k]=(++tot);
				a[tot].fa=u;
			}
			u=a[u].son[k];
		}
		if (s[i]=='B')
			u=a[u].fa;
		if (s[i]=='P')
		{
			id[++n]=u;
			fa[n]=n;
			if (a[u].tag)
				fa[n]=a[u].tag;
			else
				a[u].tag=n;
		}
	}
}

void getfail()
{
	int i,u,v,fafail;
	for (i=0;i<=25;i++)
		a[0].son[i]=1;
	a[1].fail=0;
	q.push(1);
	while (!q.empty())
	{
		u=q.front();
		q.pop();
		fafail=a[u].fail;
		for (i=0;i<=25;i++)
		{
			v=a[u].son[i];
			if (!v)
				a[u].son[i]=a[fafail].son[i];
			else
			{
				a[v].fail=a[fafail].son[i];
				q.push(v);
			}
		}
	}
}

void add(int u,int v)
{
	edge[++etot]=(node){head[u],v};
	head[u]=etot;
}

int lowbit(int x)
{
	return x&-x;
}

void update(int x,int val)
{
	for (;x<=cnt;x+=lowbit(x))
		c[x]+=val;	
}

int query(int x)
{
	int res=0;
	for (;x;x-=lowbit(x))
		res+=c[x];
	return res;
}

void DFS(int u)
{
	int i;
	dfn[u]=(++cnt);
	for (i=head[u];i;i=edge[i].nxt)
		DFS(edge[i].to);
	low[u]=cnt;
}

void dfs(int u)
{
	update(dfn[u],1);
	int i,siz=que[u].size();
	for (i=0;i<siz;i++)
		ans[que[u][i].id]=query(low[que[u][i].x])-query(dfn[que[u][i].x]-1);
	for (i=0;i<=25;i++)
		if (a[u].ch[i])
			dfs(a[u].ch[i]);
	update(dfn[u],-1);
}

int main()
{
	int i,j,u,v;
	scanf("%s",s);
	insert(s);
	for (i=1;i<=tot;i++)
		for (j=0;j<=25;j++)
			a[i].ch[j]=a[i].son[j];
	getfail();
	for (i=1;i<=tot;i++)
		if (a[i].fail!=i&&a[i].fail>=1)
			add(a[i].fail,i);
	DFS(1);
	m=read();
	for (i=1;i<=m;i++)
	{
		u=id[fa[read()]],v=id[fa[read()]];
		que[v].push_back((pro){u,i});
	}
	dfs(1);
	for (i=1;i<=m;i++)
		printf("%d\n",ans[i]);
	return 0;
}
posted @ 2020-01-27 19:19  MN2016  阅读(89)  评论(0编辑  收藏  举报