【JSOI2007】文本生成器

用AC自动机处理所有了解的单词

显然,不能直接算,直接算的话,我们需要大力容斥,复杂度不允许

我们不妨反过来做,我们根据AC自动机处理出所有的不可行解,然后用总数减去即可

计算所有不可行解用dp,\(f[i][j]\)表示处理到字符串第i位,在自动机上第j个节点的不可行方案数,直接暴力转移即可

#include<cstring>
#include<queue>
#include<cstdio>
#include<map>
#include<string>
using namespace std;
const int SIGMA_SIZE = 26;
const int MAXNODE = 11000;
const int MAXS = 150 + 10;

struct AhoCorasickAutomata {
  int ch[MAXNODE][SIGMA_SIZE];
  int f[MAXNODE];    // fail函数
  int val[MAXNODE];  // 每个字符串的结尾结点都有一个非0的val
  int last[MAXNODE]; // 输出链表的下一个结点
  int match[MAXNODE]; // 表示这个点是结点
  int cnt[MAXS]; //用来统计模式串被找到了几次
  int sz;

  void init() {
    sz = 1;
    memset(ch[0], 0, sizeof(ch[0]));
    memset(cnt, 0, sizeof(cnt));
    memset(match, 0, sizeof(match));
  }

  // 字符c的编号
  int idx(char c) {
    return c-'A';
  }

  // 插入字符串。v必须非0
  void insert(char *s, int v) {
    int u = 0, n = strlen(s);
    for(int i = 0; i < n; i++) {
      int c = idx(s[i]);
      if(!ch[u][c]) {
        memset(ch[sz], 0, sizeof(ch[sz]));
        val[sz] = 0;
        ch[u][c] = sz++;
      }
      u = ch[u][c];
    }
    val[u] = v;
  }

  // 递归打印以结点j结尾的所有字符串
  void print(int j) {
    if(j) {
      cnt[val[j]]++;
      //match[j] = 1;
      print(last[j]);
    }
  }

  // 在T中找模板
  int find(char* T) {
    int n = strlen(T);
    int j = 0; // 当前结点编号,初始为根结点
    for(int i = 0; i < n; i++) { // 文本串当前指针
      int c = idx(T[i]);
      j = ch[j][c];
      if(val[j]) print(j);
      else if(last[j]) print(last[j]); // 找到了!
    }
  }

  // 计算fail函数
  void getFail() {
    queue<int> q;
    f[0] = 0;
    // 初始化队列
    for(int c = 0; c < SIGMA_SIZE; c++) {
      int u = ch[0][c];
      if(u) { f[u] = 0; q.push(u); last[u] = 0; }
    }
    // 按BFS顺序计算fail
    while(!q.empty()) {
      int r = q.front(); q.pop();
      for(int c = 0; c < SIGMA_SIZE; c++) {
        int u = ch[r][c];
        if(!u) {ch[r][c] = ch[f[r]][c];continue;}
        q.push(u);
        int v = f[r];
        while(v && !ch[v][c]) v = f[v];
        f[u] = ch[v][c];
        last[u] = val[f[u]] ? f[u] : last[f[u]];
      }
    }
    /* *when Matrix need
    for(int i = 0; i < sz; i++) {
        if(val[i]) print(i);
        else if(last[i]) print(i);
    }
    */
    /* 统计长度为n的串有多种可能不出现模板串,需要Matrix
    int doit(int n) {
        matrix A(sz, sz);
        for(int i = 0; i < sz; i++) {
            if(match[i]) continue;
            for(int c = 0; c < SIGMA_SIZE; c++) {
                if(!match[ch[i][c]]) A[i][ch[i][c]]++;
            }
        }
        A = A ^ n;
        int ans = 0;
        for(int i = 0; i < sz; i++) {
            ans += A[0][i];
            ans %= MOD;
        }
        return ans;
    }
    */
  }

};

AhoCorasickAutomata ac;
char P[80][1100];
int n,m,T,f[110][MAXNODE];
const int mo=10007;

int dp()
{
 f[0][0]=1;
 for (int i=1;i<=m;i++)
  for (int j=0;j<=ac.sz;j++)
    if (!ac.val[j]&&f[i-1][j]>0&&!ac.last[j])
    {
      for (int k=0;k<26;k++)
        if (!ac.val[ac.ch[j][k]]&&!ac.last[ac.ch[j][k]])
          f[i][ac.ch[j][k]]=(f[i][ac.ch[j][k]]+f[i-1][j])%mo;
          //printf("%d %d %d\n",i,ac.ch[j][k],f[i][ac.ch[j][k]]);
    }
  int res=0;
  for (int i=0;i<=ac.sz;i++)
    res=(res+f[m][i])%mo;
  return res;
}

int main()
{
  scanf("%d%d", &n,&m);
    ac.init();
    for(int i = 1; i <= n; i++)
    {
      scanf("%s", P[i]);
      ac.insert(P[i], i);
    }
    ac.getFail();
    int res=dp(),ans=1;
    for (int i=1;i<=m;i++)
      ans=ans*26%mo;
  printf("%d\n",(ans+mo-res)%mo);
  return 0;
}
posted @ 2018-08-24 13:05  Xiejiadong  阅读(180)  评论(0编辑  收藏  举报
levels of contents