马拉车学习笔记
马拉车算法是一种计算最长回文子串的算法,以其优秀的线性复杂度闻名于世,相较于\(O(n^2)\)的\(dp\)算法和会被特殊数据卡到\(O(n^2)\)的暴力算法,马拉车算法无疑是求解最长回文子串的最优选择。
最长回文子串分为偶数串和奇数串,为了避免这些问题,马拉车算法将每个字符与字符间插入一个特殊字符,在两头插入不同的字符,以免越界。
马拉车算法定义:\(r\)为当前已知的对称的最右边的点,\(mid\)为\(r\)的对称轴,\(f_i\)为以\(i\)为对称轴的最长回文子串的回文半径
则我们遇到一个\(i\),分两种情况讨论
若\(mid \leq i \leq r\),则\(f_i\)可能为他的对称点,即\(f_{mid*2-i}\),但如果\(i+f_{mid*2-i}\)大于了\(r\),则就不能保证它的正确性,而能保证正确性的区域在哪儿呢?只有\(r\)以内,所以要和\(r-i+1\)取一个\(min\),然而我们不能保证它的最长回文子串一定是这个范围,所以我们要暴力拓展一下,直到不能拓展为止。
若\(r<i\),那么暴力拓展即可。
而做完这一切后,看看\(r\)和\(mid\)有没有要更新的。
而我们统计答案时一定要减掉插入的字符,我们发现,统计出来的回文半径一定是一个奇数,则结尾是一个\(\#\),将对面的对过来,得到答案为\(f_i-1\)最终答案即为\(min(f_i)-1\)
那么马拉车算法的时间复杂度是怎么证明为线性呢?
若是\(mid \leq i \leq r\)且取值为\(f_{mid*2-i}\),那么是一定不会拓展的,因为这还在这个回文半径里面,两边肯定是相同的
而其他两种情况,\(r\)是一定随着动的。所以复杂度为线性,即\(O(n)\)
代码实现:
#include<cstdio>
#include<cstring>
#define max(a,b) ((a)>(b)?(a):(b))
#define min(a,b) ((a)<(b)?(a):(b))
using namespace std;
int n,m,k,f[2000039],mr,mid,ans;
char s[2000039],x;
int main(){
register int i;
s[++n]='%';
s[++n]='#';
x=getchar();
while(x>='a'&&x<='z') s[++n]=x,s[++n]='#',x=getchar();
s[++n]='&';
mr=mid=1;
for(i=2;i<n;i++){
if(i<mr) f[i]=min(f[mid*2-i],mr-i+1);
while(s[i+f[i]]==s[i-f[i]]) f[i]++;
if(f[i]+mid>mr) mr=f[i]+i-1,mid=i;
ans=max(ans,f[i]-1);
}
printf("%d\n",ans);
}