字符串算法总结
字符串算法总结
-
AC自动机(AC_automation)
AC自动机处理的是多模式串的匹配问题。
前置知识:trie和kmp(虽然并不是真正的kmp算法)
组件:trie树,fail失配指针,e标记字符串结尾。
注意:fail记录的是相同后缀,前缀可以不同。
code:
#include<iostream>
#include<algorithm>
#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int N=1e6+10;
int n;
char a[N];
struct AC_automation
{
int trie[N][27],e[N],fail[N],cnt;
void insert(char *s)//插入和trie没区别
{
int u=0,len=strlen(s);
for(int i=0;i<len;i++)
{
int v=s[i]-'a';
if(!trie[u][v])trie[u][v]=++cnt;
u=trie[u][v];
}e[u]++;
}
void build()//bfs找fail失配指针,建立trie图
{
queue<int>q;
for(int i=0;i<26;i++)if(trie[0][i])q.push(trie[0][i]);//以根的儿子为起点
while(!q.empty())
{
int u=q.front();q.pop();
for(int i=0;i<26;i++)
{
if(trie[u][i])//如果儿子里有当前字母
{
fail[trie[u][i]]=trie[fail[u]][i];//失配指针指向当前节点失配指针指向节点的相同儿子
q.push(trie[u][i]);//注意的是,此时的儿子不是原来trie树上的真实儿子,而是trie图上的出边
}
else trie[u][i]=trie[fail[u]][i];//如果没有,在当前节点和失配指针指向节点的i儿子间连边
}
}
}
int query(char *s)
{
int u=0,len=strlen(s),res=0;
for(int i=0;i<len;i++)
{
u=trie[u][s[i]-'a'];//跑trie图
for(int j=u;j&&~e[j];j=fail[j])//找相同后缀
res+=e[j],e[j]=-1;
}return res;
}
}ac;
int main()
{
cin>>n;
for(int i=1;i<=n;i++)
{
cin>>a;
ac.insert(a);
}
ac.build();
cin>>a;
int ans=ac.query(a);
cout<<ans<<endl;
}