AcWing 1285. 单词

$AcWing$ $1285$ . 单词

一、题目描述

某人读论文，一篇论文是由许多单词组成的。

但他发现一个单词会在论文中出现很多次，现在他想知道 每个单词分别在论文中出现多少次。

输入格式
第一行一个整数 $N$ ，表示有多少个单词。

接下来 $N$ 行每行一个单词，单词中只包含小写字母。

输出格式
输出 $N$ 个整数，每个整数占一行，第 $i$ 行的数字表示第 $i$ 个单词在文章中出现了多少次。

数据范围
$1≤N≤200$ ,所有单词长度的总和不超过 $10^6$ 。

输入样例：

3
a
aa
aaa

输出样例：

6
3
1

二、解题思路

对于 $Trie$ 图，其实最难理解的是它的 $Fail$ 指针，也就是当前单词的后缀可以匹配的最长前缀，当然这里写的是 $ne$ 数组，意思是一样的。
类似于下面的这张图示：

考虑完这个问题之后，我们用题目中的例子画一张图理解一下：

为什么可以这样呢，其实就是做了一个巧妙的转化，我们发现，要找所有单词中某个单词出现的次数，其实就是看在所有的前缀的后缀中某个单词出现的次数，这不就是 $ne$ 数组的定义吗，问题也就解决了！

还有一点，我们所有 $fail$ 指针组成的边一定是一个 $DAG$ ，因为所有的 $fail$ 指针只能指向比自己层数更高的点。所以我们可以根据拓扑序来倒推，而我们用的是手写队列，就可以直接倒着遍历队列。

再来一个例子：

时间复杂度
时间复杂度是线性的，和所有单词的总长度有关，也就是 $O(n)$ 。

三、实现代码

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <iostream>

using namespace std;
const int N = 1000010;

int n;
int tr[N][26], idx;

int f[N];    // 当前节点代表的字符串在整个trie中出现的次数,也用来记录递推结果
char s[N];   // 字符串
int id[210]; // 每个单词在trie中对应节点的编号，比如id[1]=2,表示第1个模式串，在trie树中是2号节点

void insert(char *s, int x) {
    int p = 0;
    for (int i = 0; s[i]; i++) {
        int t = s[i] - 'a';
        if (!tr[p][t]) tr[p][t] = ++idx;
        p = tr[p][t];
        f[p]++; //记录p节点代表的字符串在整个trie中出现的次数
    }
    id[x] = p; //记录x号单词在trie树中的节点编号
}

int q[N], ne[N];
void bfs() {
    int hh = 0, tt = -1;
    for (int i = 0; i < 26; i++)
        if (tr[0][i]) q[++tt] = tr[0][i];

    while (hh <= tt) {
        int t = q[hh++];
        for (int i = 0; i < 26; i++) {
            if (!tr[t][i])
                tr[t][i] = tr[ne[t]][i];
            else {
                ne[tr[t][i]] = tr[ne[t]][i];
                q[++tt] = tr[t][i];
            }
        }
    }
}

int main() {
    //加快读入
    ios::sync_with_stdio(false), cin.tie(0);
    cin >> n;
    for (int i = 1; i <= n; i++) {
        cin >> s;
        insert(s, i);
    }
    // AC自动机
    bfs();

    //从下向上递推更新
    for (int i = idx; i; i--) f[ne[q[i]]] += f[q[i]];

    //输出
    for (int i = 1; i <= n; i++) printf("%d\n", f[id[i]]);
    return 0;
}

posted @ 2022-05-12 15:02 糖豆爸爸阅读(71) 评论(1) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· AcWing 1282. 搜索关键词

· AcWing 1185. 单词游戏

· 1285. 单词

· 1282. 搜索关键词

· Acwing 1285 单词

历史上的今天：
2018-05-12 C#解除文件锁定

公告

昵称：糖豆爸爸
园龄： 19年8个月
粉丝： 341
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

蒟蒻豆进阶之路

AcWing 1285. 单词