ac自动机的理解

#其他博客讲得很正规透透的了,我想提供一点通俗易懂的菜鸡视角

ac自动机的起源我猜是:

对于字符串串abcde

枚举到abcd发现e不匹配后,再回去从b开始匹配吗?

如果能知道bcd是哪个目标串的前缀就好了,我们就可以换成这个目标串继续配

失配指针就是用来找这个目标串的

字典树:存she,sher,her,fresh,fish,fit时:

 

 +=1表示多少字符串以这个作为结尾.懒狗,只写了俩;

失配指针就是当发现这条路径的儿子没有我们现在手上的字母时,我们想换模式串,的向导。

那句“让这个节点的失败指针指向(((他父亲节点)的失败指针所指向的那个节点)的下一个节点)”

翻译成人话就是,对于每点的失配指针,设该点值为i,指向的是字典树的另外某条路径上的i点,

且从根节点到指针指向的点连起来,为当前失配了的字符串的后缀,当该点失配后,跳过去还有希望配上。

为啥一定是后缀勒,这是算法保证的

找i点的失败指针时,首先找到它爸的失败指针,然后跳过去,再找找该点的儿子们有没有跟i值相同的,有的话就是它了,没有的话再跳到现在该点的失配指针

这就保证后缀了。

并且它爸的失败指针指向的是最长后缀(贪心)。

 

理解就到这里了----

实现部分:

抄的,模板题还没打,注释部分详解待填

复制代码
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<queue>
#include<algorithm>
using namespace std;
struct Tree//字典树 
{
     int fail;//失配指针
     int vis[26];//子节点的位置
     int end;//标记有几个单词以这个节点结尾 
}AC[1000000];//Trie树
int cnt=0;//Trie的指针 
inline void Build(string s)
{
        int l=s.length();
        int now=0;//字典树的当前指针 
        for(int i=0;i<l;++i)//构造Trie树
        {
                if(AC[now].vis[s[i]-'a']==0)//Trie树没有这个子节点
                   AC[now].vis[s[i]-'a']=++cnt;//构造出来
                now=AC[now].vis[s[i]-'a'];//向下构造 
        }
        AC[now].end+=1;//标记单词结尾 
}
void Get_fail()//构造fail指针
{
        queue<int> Q;//队列 
        for(int i=0;i<26;++i)//第二层的fail指针提前处理一下
        {
               if(AC[0].vis[i]!=0)
               {
                   AC[AC[0].vis[i]].fail=0;//指向根节点
                   Q.push(AC[0].vis[i]);//压入队列 
               }
        }
        while(!Q.empty())//BFS求fail指针 
        {
              int u=Q.front();
              Q.pop();
              for(int i=0;i<26;++i)//枚举所有子节点
              {
                      if(AC[u].vis[i]!=0)//存在这个子节点
                      {
                              AC[AC[u].vis[i]].fail=AC[AC[u].fail].vis[i];
                                  //子节点的fail指针指向当前节点的
                                  //fail指针所指向的节点的相同子节点 
                              Q.push(AC[u].vis[i]);//压入队列 
                      }
                      else//不存在这个子节点 
                      AC[u].vis[i]=AC[AC[u].fail].vis[i];
                      //当前节点的这个子节点指向当
                      //前节点fail指针的这个子节点 
              }
        }
}
int AC_Query(string s)//AC自动机匹配
{
        int l=s.length();
        int now=0,ans=0;
        for(int i=0;i<l;++i)
        {
                now=AC[now].vis[s[i]-'a'];//向下一层
                for(int t=now;t&&AC[t].end!=-1;t=AC[t].fail)//循环求解
                {
                         ans+=AC[t].end;
                         AC[t].end=-1;
                } 
        }
        return ans;
}
int main()
{
     int n;
     string s;
     cin>>n;
     for(int i=1;i<=n;++i)
     {
            cin>>s;
            Build(s);
     }
     AC[0].fail=0;//结束标志 
     Get_fail();//求出失配指针
     cin>>s;//文本串 
     cout<<AC_Query(s)<<endl;
     return 0;
}
复制代码

 

posted @   liyishui  阅读(62)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛(1)
点击右上角即可分享
微信分享提示