【bzoj1212】[HNOI2004]L语言 AC自动机
题目描述
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。 一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。 例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’ 在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解 而且是在字典D下能够被理解的最长的前缀。 给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。 并给出其在字典D下能够被理解的最长前缀的位置。
输入
输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。 之后的n行每行描述一个单词,再之后的m行每行描述一段文章。 其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。
输出
对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。
样例输入
4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname
样例输出
14
6
0
题解
水题
因为单词可能有包含关系,所以不能贪心来做。
由于题目中数据范围很小,可以考虑用动态规划。
f[i]表示能否理解前i个单词
把后面的字符放到Trie树中,直至没有对应子节点。
如果遇到单词,那么修改状态,f[j]|=f[i]。
最后扫一遍输出答案。
#include <cstdio> #include <cstring> #include <queue> using namespace std; queue<int> q; int nt[201][26] , cnt[201] , tot = 1; bool f[1000001]; char str[1000001]; int main() { int n , m , i , j , l , t , ans; scanf("%d%d" , &n , &m); while(n -- ) { scanf("%s" , str); l = strlen(str); t = 1; for(i = 0 ; i < l ; i ++ ) { if(!nt[t][str[i] - 'a']) nt[t][str[i] - 'a'] = ++tot; t = nt[t][str[i] - 'a']; } cnt[t] ++ ; } while(m -- ) { scanf("%s" , str); l = strlen(str); memset(f , 0 , sizeof(f)); f[0] = 1; for(i = 0 ; i < l ; i ++ ) { if(f[i]) { t = 1; j = i; while(nt[t][str[j] - 'a']) { t = nt[t][str[j ++ ] - 'a']; if(cnt[t]) f[j] |= f[i]; } } } for(i = 0 ; i <= l ; i ++ ) if(f[i]) ans = i; printf("%d\n" , ans); } return 0; }