BZOJ2434[NOI2011]阿狸的打字机

知识点：

AC自动机，fail树，离线，树状数组，主席树

题意：

给定若干个串，若干次询问(x,y)x串在y串中出现了多少次，除了值域（小写字母）外范围都是1e5.

解法：

首先，按照它给定的“打字机读入方式”，我们可以在trie上跳，模拟这一个过程。遇到小写字母，则往下跳（没有就插入新点），遇到\(B\)就跳回其父亲处（所以trie还要维护每个点父亲点的编号），遇到\(P\)就标记一下结尾的节点（假如原来有点，那么就把当前串的fa定为原来的那个串，否则新增一个编号）。假如不按上面这种方法来的话，复杂度上界是\(O(n^2)\)的。

接下来，考虑单个的(x,y)怎么匹配。注意题目问的是x在y中出现了多少次，我们要明确几个性质。

一个ACAM上的节点到根节点上的路径，每一个路径上的点都是当前点的前缀。这个用trie来理解就非常显然了。
一个fail树上的节点到根节点上的路径，每一个路径上的点都是当前点的后缀，且一定是长度依次单调递减的一个后缀。

这里补充一下什么就做fail树，fail树就是把fail指针反向连接起来形成的一棵树，具有很多很优美的性质。

那么我们通过以上两个性质，我们可以发现，问x在y中出现的次数，就是问x在fail树的子树中有多少个点是y节点在fail树中所对应节点的祖先（包括y自己）。

所以我们考虑怎么维护上面的那个信息。

假如在线做，那么每次遍历一次fail树，是\(O(n^2)\)的，所以我们必须把所有询问离线下来，因为是问y作为文本串的，所以可以选择把y排序处理。不过这里我选择开个vector直接把y对应的fa（就是在插入时，相同的话就记的那个fa）对应的ACAM上的编号挂上去，把x也同样处理后挂上去。

考虑把fail树的DFS序弄出来（因为以某个节点为根的子树一定是在DFS序上连续的一段），所以可以转化为序列上的问题用树状数组等数据结构来维护。因为每次进入走出某个节点发生的影响都是1，所以DFS一遍trie树（注意这里要在求fail之前把所有的son备份一遍，否则会连到一些原来没有的点上），一到一个点就把当前点在fail树上的DFS序所对应的点在树状数组上+1，然后回答当前点的所有询问（均为x点的子树右端点-x点的子树左端点对于的值），然后遍历所有的真儿子，然后-1走人。

注意：

搞清楚什么时候是fail，什么时候是trie。这里理解子串个人认为可以类比SAM，因为一个子串=后缀的前缀=前缀的后缀，所以是遍历trie树，但是树状数组维护的DFS序是在fail树上的。
假如你在想，为什么不是加上一个地方的所有的子串结尾的个数，而是+1？是因为题目问的是x在y中出现的次数，就算出现很多次，那也只算一次。

代码：

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<queue>
#include<vector>
using namespace std;

const int maxn=100010;
int n,m,head[maxn],etot,tot=1,c[maxn],dfn[maxn],low[maxn],fa[maxn],cnt,ans[maxn],id[maxn];
struct node
{
	int nxt,to;
}edge[maxn];
struct trie
{
	int son[26],fail,tag,fa,ch[26];
}a[maxn];
struct pro
{
	int x,id;
};
vector<pro>que[maxn];
queue<int>q;
char s[maxn];

int read()
{
	int x=0;
	char c=getchar();
	while (c<48||c>57)
		c=getchar();
	while (c>=48&&c<=57)
		x=(x<<1)+(x<<3)+(c^48),c=getchar();
	return x;
}

void insert(char *s)
{
	int i,u=1,len=strlen(s),k;
	a[1].fa=1;
	for (i=0;i<len;i++)
	{
		if (s[i]>='a'&&s[i]<='z')
		{
			k=s[i]-'a';
			if (!a[u].son[k])
			{
				a[u].son[k]=(++tot);
				a[tot].fa=u;
			}
			u=a[u].son[k];
		}
		if (s[i]=='B')
			u=a[u].fa;
		if (s[i]=='P')
		{
			id[++n]=u;
			fa[n]=n;
			if (a[u].tag)
				fa[n]=a[u].tag;
			else
				a[u].tag=n;
		}
	}
}

void getfail()
{
	int i,u,v,fafail;
	for (i=0;i<=25;i++)
		a[0].son[i]=1;
	a[1].fail=0;
	q.push(1);
	while (!q.empty())
	{
		u=q.front();
		q.pop();
		fafail=a[u].fail;
		for (i=0;i<=25;i++)
		{
			v=a[u].son[i];
			if (!v)
				a[u].son[i]=a[fafail].son[i];
			else
			{
				a[v].fail=a[fafail].son[i];
				q.push(v);
			}
		}
	}
}

void add(int u,int v)
{
	edge[++etot]=(node){head[u],v};
	head[u]=etot;
}

int lowbit(int x)
{
	return x&-x;
}

void update(int x,int val)
{
	for (;x<=cnt;x+=lowbit(x))
		c[x]+=val;	
}

int query(int x)
{
	int res=0;
	for (;x;x-=lowbit(x))
		res+=c[x];
	return res;
}

void DFS(int u)
{
	int i;
	dfn[u]=(++cnt);
	for (i=head[u];i;i=edge[i].nxt)
		DFS(edge[i].to);
	low[u]=cnt;
}

void dfs(int u)
{
	update(dfn[u],1);
	int i,siz=que[u].size();
	for (i=0;i<siz;i++)
		ans[que[u][i].id]=query(low[que[u][i].x])-query(dfn[que[u][i].x]-1);
	for (i=0;i<=25;i++)
		if (a[u].ch[i])
			dfs(a[u].ch[i]);
	update(dfn[u],-1);
}

int main()
{
	int i,j,u,v;
	scanf("%s",s);
	insert(s);
	for (i=1;i<=tot;i++)
		for (j=0;j<=25;j++)
			a[i].ch[j]=a[i].son[j];
	getfail();
	for (i=1;i<=tot;i++)
		if (a[i].fail!=i&&a[i].fail>=1)
			add(a[i].fail,i);
	DFS(1);
	m=read();
	for (i=1;i<=m;i++)
	{
		u=id[fa[read()]],v=id[fa[read()]];
		que[v].push_back((pro){u,i});
	}
	dfs(1);
	for (i=1;i<=m;i++)
		printf("%d\n",ans[i]);
	return 0;
}

posted @ 2020-01-27 19:19 MN2016 阅读(89) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

MN2016

厚积薄发，一鸣惊人！

BZOJ2434[NOI2011]阿狸的打字机

知识点：

题意：

解法：

注意：

代码：

公告