[日常摸鱼]字符串相关
最近开始学字符串…之前暑假听JOHNKROM大爷讲这个的时候就很懵(当时根本没碰过这个东西…)
这里大概会有一些相关的算法和自己做的题,还有存一些模板啥的。
由于我太弱了所以可能不会写有关原理的东西(或者等我哪天会了有空再补)如果是刚学的话还是去网上找教程吧…我就存个题还有模板啥的orz
Trie
字典树(Trie),根节点为空节点,其他节点(或边上)放字母,然后节点上还能储存一些其他信息。
1.一个类似模板题的东西:luogu2580
建一颗Trie,把所有名字插进去,结束的地方打个标记,具体见代码
#include<cstdio> #include<cstring> const int N=500005; int n,m,cnt; int tr[N][30],s[N]; char temp[55]; inline void insert(char *c) { int now=0,len=strlen(c+1); for(register int i=1;i<=len;i++) { int k=c[i]-'a'; if(tr[now][k]==0)tr[now][k]=++cnt; now=tr[now][k]; }s[now]=1; } inline int access(char *c) { int now=0,len=strlen(c+1); for(register int i=1;i<=len;i++) { int k=c[i]-'a'; if(tr[now][k]==0)return -1; now=tr[now][k]; } if(s[now]==1) { s[now]++; return 1; }else if(s[now]>1) return 0; return -1; } int main() { scanf("%d",&n); for(register int i=1;i<=n;i++) { scanf("%s",temp+1); insert(temp); } scanf("%d",&m); for(register int i=1;i<=m;i++) { scanf("%s",temp+1); int res=access(temp); if(res==-1)printf("WRONG\n"); else if(res==0)printf("REPEAT\n"); else printf("OK\n"); } return 0; }
KMP
用来在线性时间完成单个文本和模式串匹配的算法,通过一个$next$数组来优化朴素算法
(一篇看到感觉比较好的blog:http://blog.csdn.net/joylnwang/article/details/6778316/)
1.模板题:luogu3375
#include<cstdio> #include<cstring> const int N=1000005; char s[N],t[N]; int n,m,nxt[N]; int main() { scanf("%s%s",s+1,t+1); n=strlen(s+1);m=strlen(t+1); nxt[1]=0; for(register int i=2,j=0;i<=m;i++) { while(j&&t[i]!=t[j+1])j=nxt[j]; if(t[i]==t[j+1])j++; nxt[i]=j; } for(register int i=1,j=0;i<=n;i++) { while(j&&t[j+1]!=s[i])j=nxt[j]; if(s[i]==t[j+1])j++; if(j==m) { j=nxt[j]; printf("%d\n",i-m+1); } } for(register int i=1;i<=m;i++)printf("%d ",nxt[i]); }
2.找最小循环节:poj2406
题意:求最大的$n$使得给定的$s=a^n$,$a$为某个字符串($a^n$就是$n$个$a$拼在一起)
要让$n$最大那就要让$|a|$最小,所以就是要找最小循环节的长度,注意到KMP求出来的$next[i]$的意义是从开头到$i$的子串里前缀和后缀相等的最长的长度,那么$n-next[n]$就是要求最小循环节辣!然后如果求出来的长度不能被$|s|$整除那答案就是1
#include<cstdio> #include<cstring> const int N=1000005; int n,temp,ans,nxt[N]; char s[N]; int main() { while(1) { memset(nxt,0,sizeof(nxt)); scanf("%s",s+1);if(s[1]=='.')break; n=strlen(s+1);nxt[1]=0;int i,j;ans=0; for(i=2,j=0;i<=n;i++) { while(j&&s[j+1]!=s[i])j=nxt[j]; if(s[j+1]==s[i])j++; nxt[i]=j; } temp=n-nxt[n]; if(n%temp==0)ans=n/temp; else ans=1; printf("%d\n",ans); } return 0; }
3.HDU1358
类似上一题
这两个应该都算kmp相关的经典问题吧x
#include<cstdio> #include<cstring> const int N=1000005; char s[N]; int n,k,temp,nxt[N]; int main() { while(scanf("%d",&n)==1&&n) { printf("Test case #%d\n",++k); scanf("%s",s+1);nxt[1]=0; for(register int i=2,j=0;i<=n;i++) { while(j&&s[j+1]!=s[i])j=nxt[j]; if(s[j+1]==s[i])j++; nxt[i]=j; } for(register int i=2;i<=n;i++) { temp=i-nxt[i]; if(i%temp==0&&i>temp)printf("%d %d\n",i,i/temp); }printf("\n"); } return 0; }
Manacher
求一个字符串的最长回文子串
1. 模板题:luogu3805
#include<cstdio> #include<cstring> #include<algorithm> using namespace std; const int N=25000005; int n,ans,p[N]; char s[N],str[N]; inline void manacher() { int mx=0,pos=0; for(register int i=n;str[i]!=0;i++)str[i]=0; for(register int i=1;i<n;i++) { if(mx>i)p[i]=min(p[2*pos-i],p[pos]+pos-i); else p[i]=1; for(;str[i+p[i]]==str[i-p[i]];++p[i]); if(p[i]+i>mx){mx=p[i]+i;pos=i;} } } inline void init() { str[0]=str[1]='#'; for(register int i=0;i<n;i++)str[(i<<1)+2]=s[i],str[(i<<1)+3]='#'; n=(n<<1)+2;str[n]=0; } int main() { scanf("%s",s); n=strlen(s);init();manacher(); for(register int i=0;i<n;i++)ans=max(ans,p[i]); printf("%d",ans-1); }
AC自动机
Aho-Corasick自动机,一个文本串和多个模式串进行匹配
1.模板题:luogu3808
#include<cstdio> #include<cstring> #include<queue> using namespace std; const int N=1000005; const int S=26; char s[N]; int n; queue<int>q; struct ac_automation { int cnt; int tr[N][S+3],fail[N],val[N]; inline void insert(char *c) { int len=strlen(c+1),k=0; for(register int i=1;i<=len;i++) { int t=c[i]-'a'; if(!tr[k][t])tr[k][t]=++cnt; k=tr[k][t]; }val[k]++; } inline void build() { for(register int i=0;i<S;i++)if(tr[0][i])fail[tr[0][i]]=0,q.push(tr[0][i]); while(!q.empty()) { int k=q.front();q.pop(); for(register int i=0;i<S;i++) { if(tr[k][i])q.push(tr[k][i]),fail[tr[k][i]]=tr[fail[k]][i]; else tr[k][i]=tr[fail[k]][i]; } } } inline int solve(char *c) { int len=strlen(c+1),k=0,ans=0; for(register int i=1;i<=len;i++) { k=tr[k][c[i]-'a']; for(register int j=k;j&&~val[j];j=fail[j])ans+=val[j],val[j]=-1; }return ans; } }ac; int main() { scanf("%d",&n); for(register int i=1;i<=n;i++)scanf("%s",s+1),ac.insert(s); ac.build();scanf("%s",s+1);printf("%d",ac.solve(s)); return 0; }
我好像也只会模板了orz
2.需要统计次数的luogu3796 / uvalive4670
T_T我好像只会写而已…
#include<cstdio> #include<cstring> #include<queue> using namespace std; const int N=1000005; const int S=26; char s[N],str[155][75]; int n,mark[N]; queue<int>q; struct ac_automation { int cnt; int tr[N][S+3],fail[N],val[N],last[N]; inline void init() { for(register int i=0;i<=cnt;i++) { memset(tr[i],0,sizeof(tr[i])); fail[i]=val[i]=last[i]=mark[i]=0; } for(register int i=1;i<=n;i++)memset(str[i],0,sizeof(str[i])); cnt=n=0; } inline void insert(char *c,int p) { int len=strlen(c+1),k=0; for(register int i=1;i<=len;i++) { int t=c[i]-'a'; if(!tr[k][t])tr[k][t]=++cnt; k=tr[k][t]; } val[k]=p; } inline void build() { while(!q.empty())q.pop(); for(register int i=0;i<S;i++)if(tr[0][i])q.push(tr[0][i]); while(!q.empty()) { int k=q.front();q.pop(); for(register int i=0;i<S;i++) { if(tr[k][i]) { int v=tr[k][i]; fail[tr[k][i]]=tr[fail[k]][i]; last[v]=(val[fail[v]]?fail[v]:last[fail[v]]); q.push(tr[k][i]); } else tr[k][i]=tr[fail[k]][i]; } } } inline void solve(char *c) { int len=strlen(c+1),mx=0,k=0; for(register int i=1;i<=len;i++) { k=tr[k][c[i]-'a']; if(val[k])mark[val[k]]++; int t=last[k]; while(t) { if(val[t])mark[val[t]]++; t=last[t]; } } for(register int i=1;i<=n;i++)mx=max(mx,mark[i]);printf("%d\n",mx); for(register int i=1;i<=n;i++)if(mark[i]==mx)printf("%s\n",str[i]+1); } }ac; int main() { while(scanf("%d",&n)==1) { if(n==0)break; for(register int i=1;i<=n;i++)scanf("%s",str[i]+1),ac.insert(str[i],i); ac.build();scanf("%s",s+1);ac.solve(s);ac.init(); } return 0; }
to be continued