[BZOJ3940]:[Usaco2015 Feb]Censoring(AC自动机)

题目传送门


题目描述

FJ把杂志上所有的文章摘抄了下来并把它变成了一个长度不超过105的字符串S。他有一个包含n个单词的列表,列表里的n个单词
记为t1…tN。他希望从S中删除这些单词。
FJ每次在S中找到最早出现的列表中的单词(最早出现指该单词的开始位置最小),然后从S中删除这个单词。他重复这个操作直到S
没有列表里的单词为止。(注意删除一个单词后可能会导致S中出现另一个列表中的单词
FJ注意到列表中的单词不会出现一个单词是另一个单词子串的情况,这意味着每个列表中的单词在S中出现的开始位置是互不相同的
请帮助FJ完成这些操作并输出最后的S


输入格式

第一行包含一个字符串S
第二行包含一个整数N接下来的N行,每行包含一个字符串,第i行的字符串是ti​​


输出格式

一行,输出操作后的S


样例

样例输入:

begintheescapexecutionatthebreakofdawn
2
escape
execution

样例输出:

beginthatthebreakofdawn


数据范围与提示

n≤2000


题解

不难想到这样一道题:

给出两个字符串ST,每次从前往后找到S的一个子串A=T并将其删除,空缺位依次向前补齐,重复上述操作多次,直到S串中不含T串。输出最终的S串。(原题见[BZOJ3942]:[Usaco2015 Feb]Censoring

很显然是一道KMP水题,大体思路就是求Tnxt数组,将S依次入栈,跑KMP,在此就不做过多的赘述。

那么这时候出现了多个串,怎么办呢?

暴力hash时间复杂度O(n2),显然不能接受。(虽说我有个队友直接卡常A掉了叭~

显然这道题与BZOJ3942的区别在于这道题是多模式串匹配,而那道题是单模式串匹配,不难想到AC自动机。

在此不会AC自动机的大佬可以看我这篇博客:AC自动机讲解+[HDU2222]Keywords Search(AC自动机)

那么我们再结合BZOJ3942的思想,首先Trie树中end数组的意义定义为在当前点结束的串的长度是多少,然后匹配的时候开一个栈,边匹配边压栈,发现匹配到的当前点end[p]不为0(即为有串在当前点结束),则需要暴力将栈中后end[p]位弹出(即为将栈中的这个单词弹出)。需要注意的一点是,弹栈之后要将当前匹配的节点恢复到栈顶元素的位置,然后从下一个元素开始继续匹配。


代码时刻

#include<bits/stdc++.h>
using namespace std;
int cnt,sum,nxt[100001],trie[100001][30],end[100001],que[100001];
char s[100001],str[100001];
int ans[100001],ani[100001];
int n;
void insert(char *str)
{
	int len=strlen(str);
	int p=1;
	for(int k=0;k<len;k++)
	{
		int ch=str[k]-'a';
		if(!trie[p][ch])
			trie[p][ch]=++cnt;
		p=trie[p][ch];
	}
	end[p]=len;//end数组记录在当前点结束的串的长度 
}
void _doudou()
{
	for(int i=0;i<26;i++)
		trie[0][i]=1;
	que[1]=1;
	for(int head=1,tail=1;head<=tail;head++)
		for(int i=0;i<26;i++)
			if(!trie[que[head]][i])trie[que[head]][i]=trie[nxt[que[head]]][i];
			else
			{
				que[++tail]=trie[que[head]][i];
				nxt[trie[que[head]][i]]=trie[nxt[que[head]]][i];
			}
}
void find(char *str)
{
	int len=strlen(str),p=1;
	for(int i=0;i<len;i++)
	{
		int ch=str[i]-'a';
		p=trie[p][ch];
		ans[++sum]=p;
		ani[sum]=i;//记录栈中每一个点在原串中的位置 
		if(end[p])//发现有单词在这个点结束 
		{
			sum-=end[p];//暴力弹栈 
			p=ans[sum];
		}
	}
}
int main()
{
	scanf("%s",str);
	cnt=1;
	scanf("%d",&n);
	for(int i=1;i<=n;i++)
	{
		scanf("%s",s);
		insert(s);
	}
	_doudou();
	find(str);
	for(int i=1;i<=sum;i++)//输出 
		cout<<str[ani[i]];
	return 0;
}

cpp


下面是hash暴力O(n2)过掉这道题的队友,疯狂register卡常,想打正解的大佬就不要往下看啦哈哈

#include<iostream>
#include<algorithm>
#include<cmath>
#include<cstring>
#include<cstdio>
#include<vector>
#include<queue>
#include<set>
#include<map>
#define ull unsigned long long 
using namespace std;
const int p=131;
char s[100050];
char s1[100050];
ull h[2005];
ull hstack[100050];
ull base[100050];
int istack[100050];
int l[2005];
int top,n,len;
int main(){
	scanf("%s",s+1);
	len=strlen(s+1);
	scanf("%d",&n);
	base[0]=1;
	for(register int i=1;i<=n;i++){
		scanf("%s",s1+1);
		l[i]=strlen(s1+1);
		for(int j=1;j<=l[i];j++)
			h[i]=h[i]*p+s1[j]-'a'+1;
	}
	for(register int i=1;i<=100050;i++)
		base[i]=base[i-1]*p;
	for(register int i=1;i<=len;i++){
		istack[++top]=i;
		hstack[top]=hstack[top-1]*p+s[i]-'a'+1;
		for(register int j=1;j<=n;j++)
			if(hstack[top]-hstack[top-l[j]]*base[l[j]]==h[j]){
				top-=l[j];break;
			}
	}
	for(register int i=1;i<=top;i++)
		putchar(s[istack[i]]);
	return 0;
}

 


rp++

posted @ 2019-06-14 20:01  HEOI-动动  阅读(215)  评论(0编辑  收藏  举报