BZOJ 1212: [HNOI2004]L语言 [AC自动机 DP]

1212: [HNOI2004]L语言

Time Limit: 10 Sec  Memory Limit: 162 MB
Submit: 1367  Solved: 598
[Submit][Status][Discuss]

Description

标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。 一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。 例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’ 在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解 而且是在字典D下能够被理解的最长的前缀。 给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。 并给出其在字典D下能够被理解的最长前缀的位置。

Input

输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。 之后的n行每行描述一个单词,再之后的m行每行描述一段文章。 其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。

Output

对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。

Sample Input

4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname

Sample Output

14
6
0 整段文章’whatisyourname’都能被理解
前缀’whatis’能够被理解
没有任何前缀能够被理解

因为
对于到字符i,AC自动机走到x,对应的字符串是B[1,i]的一个后缀,所有x在fail树中的祖先结点对应的字符串都是B[1,i]的一个后缀。
所以t[u].len表示以u结尾单词的长度,令f[i]为到i是否合法,枚举文章的字符到i时找fail树上所有祖先(文章[1,i]的所有合法后缀)然后转移就行了(如果这个祖先是单词,就看f[i-t[].len])
 
据说trie树暴力也可以
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int N=1e6+5,M=205;
int n,m;
char s[N],ss[15];
struct node{
    int ch[26],fail,fa,len;
}t[N];
int sz;
void ins(char s[]){
    int u=0,n=strlen(s+1);
    for(int i=1;i<=n;i++){
        int c=s[i]-'a';
        if(!t[u].ch[c]) t[u].ch[c]=++sz;
        u=t[u].ch[c];
    }
    t[u].len=n;
}
int q[N],head,tail;
void getAC(){
    head=tail=1;
    for(int i=0;i<26;i++) 
        if(t[0].ch[i]) q[tail++]=t[0].ch[i];
    while(head!=tail){
        int u=q[head++];
        for(int i=0;i<26;i++){
            int &v=t[u].ch[i];
            if(!v) {v=t[t[u].fail].ch[i];continue;}
            t[v].fail=t[t[u].fail].ch[i];
            q[tail++]=v;
        }
    }
}
int ans,f[N];
void AC(char s[]){
    ans=0;memset(f,0,sizeof(f));
    f[0]=1;
    int now=0,n=strlen(s+1);
    for(int i=1;i<=n;i++){
        int c=s[i]-'a';
        now=t[now].ch[c];//printf("hi %d %d %d\n",i,c,now);
        for(int _=now;_;_=t[_].fail) if(t[_].len){
            f[i]|=f[i-t[_].len];
            if(f[i]) {ans=i;break;}
        }
    }
}
int main(){
    //freopen("in.txt","r",stdin);
    scanf("%d%d",&n,&m);
    for(int i=1;i<=n;i++) scanf("%s",ss+1),ins(ss);
    getAC();
    for(int i=1;i<=m;i++){
        scanf("%s",s+1);
        AC(s);
        printf("%d\n",ans);
    }
}

 

 
posted @ 2016-12-25 15:51  Candy?  阅读(490)  评论(0编辑  收藏  举报