【BZOJ1212】[HNOI2004]L语言 Trie树

【BZOJ1212】[HNOI2004]L语言

Description

标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。 一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。 例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’ 在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解 而且是在字典D下能够被理解的最长的前缀。 给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。 并给出其在字典D下能够被理解的最长前缀的位置。

Input

输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。 之后的n行每行描述一个单词,再之后的m行每行描述一段文章。 其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。

Output

对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。

Sample Input

4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname

Sample Output

14
6
0 整段文章’whatisyourname’都能被理解
前缀’whatis’能够被理解
没有任何前缀能够被理解
题解:由于每个单词长度不超过10,那我们就直接暴力枚举单词的起始点,然后插到Trie树里,如果搜到了某个结束点,就f[i]=f[i-len]
其实不太理解1M到底是什么鬼

 

#include <cstdio>
#include <cstring>
#include <iostream>
#include <queue>
using namespace std;
int n,m,tot,len;
struct word
{
    int ch[26],cnt;
}p[300];
char w[20],str[1000010];
int f[1000010],ans;
int main()
{
    scanf("%d%d",&n,&m);
    int i,j,k,u,t,l;
    tot=1;
    for(i=1;i<=n;i++)
    {
        scanf("%s",w);
        k=strlen(w);
        u=1;
        for(j=0;j<k;j++)
        {
            if(!p[u].ch[w[j]-'a'])    p[u].ch[w[j]-'a']=++tot;
            u=p[u].ch[w[j]-'a'];
        }
        p[u].cnt=1;
    }
    for(i=1;i<=m;i++)
    {
        scanf("%s",str);
        len=strlen(str);
        memset(f,0,sizeof(f));
        f[0]=u=1;
        ans=0;
        for(j=0;j<len;j++)
        {
            if(!f[j])    continue;
            u=1,k=j;
            while(p[u].ch[str[k]-'a'])
            {
                u=p[u].ch[str[k++]-'a'];
                if(p[u].cnt)    f[k]|=f[j];
            }
        }
        for(j=1;j<=len;j++)    if(f[j])    ans=j;
        printf("%d\n",ans);
    }
    return 0;
}
posted @ 2017-01-09 08:57  CQzhangyu  阅读(490)  评论(0编辑  收藏  举报