HNOI2004 L语言

L语言

标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。 一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。 例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’ 在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解 而且是在字典D下能够被理解的最长的前缀。 给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。 并给出其在字典D下能够被理解的最长前缀的位置。

Clove_unique的题解

DP的思路非常好想,就是\(f(i)\)表示前\(i\)个是不是合法的串,状态类似01背包,可以知道如果位置\(i\)减去任何一个后缀如果是合法的那\(f(i)\)一定是合法的,那么就建立AC自动机,每个位置跳last就可以了。

一次匹配的时间是1M,由于树的深度是10,所以总时间复杂度为\(O(20∗10∗1M)\)


我实测bitset要慢一些……或许bitset只有空间上的优势。
co int N=201,S=1e6+1;
namespace AC
{
	int tot;
	int ch[N][26],val[N];
	int fail[N],last[N];
	
	void ins(char s[],int n)
	{
		int u=0;
		for(int i=0;i<n;++i)
		{
			int k=s[i]-'a';
			if(!ch[u][k])
				ch[u][k]=++tot;
			u=ch[u][k];
		}
		val[u]=n;
	}
	
	void getfail()
	{
		std::queue<int>Q;
		for(int i=0;i<26;++i)
			if(ch[0][i])
				Q.push(ch[0][i]);
		while(Q.size())
		{
			int u=Q.front();Q.pop();
			last[u]=val[fail[u]]?fail[u]:last[fail[u]];
			for(int i=0;i<26;++i)
			{
				if(ch[u][i])
				{
					fail[ch[u][i]]=ch[fail[u]][i];
					Q.push(ch[u][i]);
				}
				else
					ch[u][i]=ch[fail[u]][i];
			}
		}
	}
	
	bool f[S];
	
	void solve(char s[],int n)
	{
		std::fill(f+1,f+n+1,0);
		f[0]=1;
		int u=0;
		for(int i=0;i<n;++i)
		{
			int k=s[i]-'a';
			int v=ch[u][k];
			while(v)
			{
				f[i+1]=f[i+1]|f[i+1-val[v]];
				v=last[v];
			}
			u=ch[u][k];
		}
		for(int i=n;i>=0;--i)
			if(f[i])
			{
				printf("%d\n",i);
				break;
			}
	}
}
char buf[S];

int main()
{
//	freopen(".in","r",stdin);
//	freopen(".out","w",stdout);
	int n,m;
	read(n),read(m);
	for(int i=1;i<=n;++i)
	{
		scanf("%s",buf);
		AC::ins(buf,strlen(buf));
	}
	AC::getfail();
	for(int i=1;i<=m;++i)
	{
		scanf("%s",buf);
		AC::solve(buf,strlen(buf));
	}
	return 0;
}

posted on 2019-01-26 07:50  autoint  阅读(244)  评论(0编辑  收藏  举报

导航