Acwing 1053 修复DNA

Acwing 1053 修复DNA

题意:

给出\(n\)个字符串,这些字符串为致病因子,给出一个字符串,求将这些字符串处理成没有致病因子,最少需要改变多少个字符数量

请问,其中有多少个单词在文章中出现了。

思路:

利用AC自动机来实现多字符串匹配,设f[i][j]为,前i个字符,当前匹配到j

注意标记哪些点不可取,如果当前的前缀不可取,当前点一定也不可取,因为会包含致病因子。

实现:

#include <stdio.h>
#include <algorithm>
#include <cstring>
using namespace std;
const int N = 10010, S = 55, M = 100010;
int n, tr[N * S][27], cnt[N * S], idx;
char str[M];
int q[N * S], ne[N * S];
void insert()
{
    int p = 0;
    for (int i = 1; str[i]; i++)
    {
        int t = str[i] - 'a' + 1;
        if (!tr[p][t])
            tr[p][t] = idx++;
        p = tr[p][t];
    }
    cnt[p]++;
}
void build()
{
    int hh = 1, tt = 0;
    for (int i = 1; i <= 26; i++)
        if (tr[0][i])
            q[++tt] = tr[0][i];
    while (hh <= tt)
    {
        int t = q[hh++];
        for (int i = 1; i <= 26; i++)
        {
            int p = tr[t][i];
            if (!p)
                tr[t][i] = tr[ne[t]][i];
            else
            {
                ne[p] = tr[ne[t]][i];
                q[++tt] = p;
            }
        }
    }
}
int main()
{
    int _;
    scanf("%d", &_);
    while (_--)
    {
        memset(tr, 0, sizeof tr);
        memset(cnt, 0, sizeof cnt);
        memset(ne, 0, sizeof ne);
        idx = 1;
        scanf("%d", &n);
        for (int i = 1; i <= n; i++)
        {
            scanf("%s", str + 1);
            insert();
        }
        build();
        scanf("%s", str + 1);
        int res = 0;
        for (int i = 1, j = 0; str[i]; i++)
        {
            int t = str[i] - 'a' + 1;
            j = tr[j][t];
            int p = j;
            while (p)
            {
                res += cnt[p];
                cnt[p] = 0;
                p = ne[p];
            }
        }
        printf("%d\n", res);
    }
    return 0;
}

posted @ 2022-08-07 17:52  zxr000  阅读(25)  评论(0编辑  收藏  举报