字符串算法总结

字符串算法总结

  • AC自动机(AC_automation)

  AC自动机处理的是多模式串的匹配问题。

  前置知识:trie和kmp(虽然并不是真正的kmp算法)

  组件:trie树,fail失配指针,e标记字符串结尾。

  注意:fail记录的是相同后缀,前缀可以不同。

  板子1

 

  code:

#include<iostream>
#include<algorithm>
#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int N=1e6+10;
int n;
char a[N];

struct AC_automation
{
    int trie[N][27],e[N],fail[N],cnt;
    void insert(char *s)//插入和trie没区别 
    {
        int u=0,len=strlen(s);
        for(int i=0;i<len;i++)
        {
            int v=s[i]-'a';
            if(!trie[u][v])trie[u][v]=++cnt;
            u=trie[u][v];
        }e[u]++;
    }
    
    void build()//bfs找fail失配指针,建立trie图 
    {
        queue<int>q;
        for(int i=0;i<26;i++)if(trie[0][i])q.push(trie[0][i]);//以根的儿子为起点 
        while(!q.empty())
        {
            int u=q.front();q.pop();
            for(int i=0;i<26;i++)
            {
                if(trie[u][i])//如果儿子里有当前字母 
                {
                    fail[trie[u][i]]=trie[fail[u]][i];//失配指针指向当前节点失配指针指向节点的相同儿子 
                    q.push(trie[u][i]);//注意的是,此时的儿子不是原来trie树上的真实儿子,而是trie图上的出边 
                }
                else trie[u][i]=trie[fail[u]][i];//如果没有,在当前节点和失配指针指向节点的i儿子间连边 
            }
        }
    }
    
    int query(char *s)
    {
        int u=0,len=strlen(s),res=0;
        for(int i=0;i<len;i++)
        {
            u=trie[u][s[i]-'a'];//跑trie图 
            for(int j=u;j&&~e[j];j=fail[j])//找相同后缀 
            res+=e[j],e[j]=-1;
        }return res;
    }    
}ac;

int main()
{
    cin>>n;
    for(int i=1;i<=n;i++)
    {
        cin>>a;
        ac.insert(a);
    }
    ac.build();
    cin>>a;
    int ans=ac.query(a);
    cout<<ans<<endl;
}

 

posted @ 2019-06-22 15:22  EPs1l0h  阅读(187)  评论(0编辑  收藏  举报