BZOJ 1030(AC自动机+dp)
传送门
题面:
1030: [JSOI2007]文本生成器
Time Limit: 1 Sec Memory Limit: 162 MB
Submit: 6094 Solved: 2580
[Submit][Status][Discuss]
Description
JSOI交给队员ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,
他们现在使用的是GW文本生成器v6版。该软件可以随机生成一些文章―――总是生成一篇长度固定且完全随机的文
章—— 也就是说,生成的文章中每个字节都是完全随机的。如果一篇文章中至少包含使用者们了解的一个单词,
那么我们说这篇文章是可读的(我们称文章a包含单词b,当且仅当单词b是文章a的子串)。但是,即使按照这样的
标准,使用者现在使用的GW文本生成器v6版所生成的文章也是几乎完全不可读的?。ZYX需要指出GW文本生成器 v6
生成的所有文本中可读文本的数量,以便能够成功获得v7更新版。你能帮助他吗?
Input
输入文件的第一行包含两个正整数,分别是使用者了解的单词总数N (<= 60),GW文本生成器 v6生成的文本固
定长度M;以下N行,每一行包含一个使用者了解的单词。这里所有单词及文本的长度不会超过100,并且只可能包
含英文大写字母A..Z
Output
一个整数,表示可能的文章总数。只需要知道结果模10007的值。
Sample Input
2 2
A
B
Sample Output
100
题面分析:
首先,多串匹配,我们不难想到用AC自动机去维护。
不难发现,如果没有限制,一个长度为m的字符串最多可能构成 26^m种字符串。而如果加上限制条件,我们直接去算可行的方案就相当困难。但是我们发现,不可行的方案相对来说比较好求,只需要剔除完整的字符串的方案数即可。因此我们可以优先考虑西安求出不可行的方案数res,并用 26^m-res即为需要求的可行的结果。
而对于不可行的方案数,我们可以用dp记录方案数去求解。我们设dp[i][j]为当前长度为i的字符串处于Trie树中的第j号结点所具有的方案数。
根据AC自动机next数组的性质,我们不难发现,长度为i+1,位于第j个结点的方案数可以转移到长度为i,位于第next[j][k]结点的方案数,即dp[i+1][j]=dp[i+1][j]+dp[i][next[j][k]]。而当我们遍历到第j 个结点时发现它可以作为终止结点,我们就跳过该结点,此时就可以求出不符合条件(凑不出完整字符串)的方案数了。
代码:
#include <bits/stdc++.h>
#define maxn 105
using namespace std;
int dp[maxn][7000];
char s[500];
const int mod=10007;
int n,m;
struct Trie{
int next[10000][26],fail[10000],End[10000],id,root;
int newnode(){
for(int i=0;i<26;i++){
next[id][i]=-1;
}
End[id]=0;
return id++;
}
void init(){
id=0;
root=newnode();
}
void Insert(char *str){
int len=strlen(str);
int now=root;
for(int i=0;i<len;i++){
if(next[now][str[i]-'A']==-1){
next[now][str[i]-'A']=newnode();
}
now=next[now][str[i]-'A'];
}
End[now]=1;
}
void build(){
queue<int>que;
fail[root]=root;
for(int i=0;i<26;i++){
if(next[root][i]==-1){
next[root][i]=root;
}
else{
fail[next[root][i]]=root;
que.push(next[root][i]);
}
}
while(!que.empty()){
int now=que.front();
que.pop();
for(int i=0;i<26;i++){
if(next[now][i]==-1){
next[now][i]=next[fail[now]][i];
}
else{
fail[next[now][i]]=next[fail[now]][i];
que.push(next[now][i]);
}
}
End[now]|=End[fail[now]];//终点标志也需要转移
}
}
}ac;
int powmod(int a,int n){
int res=1;
while(n){
if(n&1) res=res*a%mod;
a=a*a%mod;
n>>=1;
}
return res;
}
void solve(){
dp[0][0]=1;
for(int i=1;i<=m;i++){
for(int j=0;j<=ac.id;j++){
if(ac.End[j]) continue;//如果当前位为某一个串的终点
for(int k=0;k<26;k++){
if(ac.End[ac.next[j][k]]) continue;
dp[i][ac.next[j][k]]=(dp[i][ac.next[j][k]]+dp[i-1][j])%mod;
}
}
}
int res=0;
for(int i=0;i<=ac.id;i++){
res=(res+dp[m][i])%mod;
}
cout<<(powmod(26,m)-res+mod)%mod<<endl;
}
int main()
{
scanf("%d%d",&n,&m);
ac.init();
while(n--){
scanf("%s",s);
ac.Insert(s);
}
ac.build();
solve();
}