AC自动机

AC自动机 相当于就是Trie树 + KMP

Trie树就是把关键字按字母存在树上 每一条路径构成一个单词 像这样

主要有fail指针 success指针和 emit指针

fail指针相当于KMP中的next数组

如果某节点a的父节点的fail指针指向的节点的孩子中有和这个节点a相同的字母的节点b 那么这个a的fail指针就指向b

构造fail指针的复杂度是O(n) n是所有树中所有单词的长度

 

匹配过程分两种情况:

  • 当前字符匹配,表示从当前节点沿着树边有一条路径可以到达目标字符,此时只需沿该路径走向下一个节点继续匹配即可,目标字符串指针移向下个字符继续匹配;
  • 当前字符不匹配,则去当前节点fail指针所指向的字符继续匹配,匹配过程随着指针指向root结束。重复这2个过程中,直到模式串走到结尾为止。

假设有N个模式串,平均长度为L;文章长度为M。

建立Trie树:O(N*L)

建立fail指针:O(N*L)

模式匹配:O(M*L) (注:之所以要乘以一个L,是因为在统计的时候需要顺着链回溯到root结点)

所以,总时间复杂度为:O( (N+M)*L )

posted @ 2018-09-07 14:50  wyboooo  阅读(124)  评论(0编辑  收藏  举报