【8】Manacher算法学习笔记
前言
Manacher 算法是最好写的字符串算法。——教练
暴力求法
给出一个只由小写英文字符 组成的字符串 ,求 中最长回文串的长度 。
暴力算法 :
枚举左右端点, 判断是否为回文串,时间复杂度 。
暴力算法 :
枚举中间点(包括字符与字符之间的空隙),根据回文串的性质,向左右两边扩展。如果左右并不相等,立即结束并更新答案;否则将左右各推一个字符,当前答案自增。时间复杂度 。
但是,此题的数据范围是 。
Manacher 算法
预处理
Manacher 算法是基于暴力算法 的再优化,由于回文串的对称中心有可能会在两个字符之间的空隙处,所以我们可以插入一些特殊字符,例如 #
。为了避免越界,我在字符串开头也插入了一个特殊字符 !
。
下标从 开始。
由于格式影响,代码中与 公式相冲突的字符改为了 !
。
scanf("%s",stri);
int l=strlen(stri);
str[0]='!';
for(int i=0;i<l;i++)
{
str[i*2+1]='#';
str[i*2+2]=stri[i];
}
str[l*2+1]='#';
l=l*2+1;
最长回文延伸长度
以 为中心的最长回文延伸长度,记作 。
例如,字符串 abaaabaa
的 p 数组:
a | b | a | a | a | a | b | a | a | |
---|---|---|---|---|---|---|---|---|---|
注意一个字符也算回文串,所以 的最小值为 。
可以知道,对于每个位置 ,以 为中心的最长回文串的起始位置为 ,结束位置为 。
算法流程
由于回文串在回文中心左右的部分完全对称,我们可以考虑从这一点来优化算法,进行递推。Manacher 算法的递推方向就是从左到右。(下标从 开始)
:最理想的情况
(自绘插图,略显粗糙)
如图, 表示目前求出的回文串中最远延伸的点,而 表示这个字符串的对称中心。点 是我们正在求的点,点 是关于 的对称点。由回文串的对称性可以得出 和 两段一定完全相等,进一步推出以 为回文中心的串一定与以 为回文中心的串完全相等,所以 。
因为 一定在 之前,符合递推的条件。 的坐标可以 求出,由坐标中点公式得出 ,整个这种情况下的转移就可以 实现了。
:不是很理想的情况
出界的部分不能保证与 出界的部分完全相同,此时 不一定等于 。但是我们可以知道在 这个范围内的部分完全相等,也就是说,在不超过这个范围的部分,以 为回文中心的串一定与以 为回文中心的串完全相等,观察以下图,其实就是 。剩下的,就朴素吧。
由于每次朴素之后会把 往后推,所以时间复杂度还是 。
:很不理想的情况
无能为力了,只能朴素了。由于每次朴素之后会把 往后推,所以时间复杂度还是 。
具体实现的时候,可以首先判定是否为情况 ,然后可以直接用一个 函数处理出情况 和情况 。因为当处于情况 时,情况 的数值小于情况 ;而处于情况 时,情况 的数值小于情况 。最后在结合插入字符,朴素比较即可,注意更新 和 。
这里实现时, 的值是 ,是可以取到的最后一个位置的后一个位置,是不能取到的。所以代码中才写 ,,这样写是为了节约一点点码量,但实际中不建议这么写,容易被误解。
p[1]=1;maxn=0;id=0;
for(int i=1;i<=l;i++)
{
if(maxn>i)p[i]=min(p[id*2-i],maxn-i);
else p[i]=1;
while(str[i-p[i]]==str[i+p[i]])p[i]++;
if(i+p[i]>maxn)maxn=i+p[i],id=i;
}
由于插入字符的影响,我们注意到 就是以 为中心的最长回文子串的长度,直接遍历一遍求最大值,就在 的时间内解决了问题。
例题
例题 :
Manacher 模板题,不多赘述。
#include <bits/stdc++.h>
using namespace std;
int p[22000010],maxn=0,id=0,ans=0;
char stri[11000010],str[22000010];
int main()
{
scanf("%s",stri);
int l=strlen(stri);
str[0]='!';
for(int i=0;i<l;i++)
{
str[i*2+1]='#';
str[i*2+2]=stri[i];
}
str[l*2+1]='#';
l=l*2+1;
p[1]=1;maxn=0;id=0;
for(int i=1;i<=l;i++)
{
if(maxn>i)p[i]=min(p[id*2-i],maxn-i);
else p[i]=1;
while(str[i-p[i]]==str[i+p[i]])p[i]++;
if(i+p[i]>maxn)maxn=i+p[i],id=i;
}
for(int i=1;i<=l;i++)
ans=max(p[i]-1,ans);
printf("%d",ans);
return 0;
}
例题 :
看到题目中提到了回文串,自然联想到 Manacher 算法。
首先,如果一个回文串的长度为 ( 为奇数且 ),则这个串同样也可以算作一个长度为 的回文串。因为这个回文串可以删去其最左右两边的两个字符,变成长度为 的串。由于原串是回文串,所以删去的字符相同,新串依旧是回文串。
有了这点,我们很容易得到一个思路:首先求出每个位置的最长回文子串,用一个桶记录下来。然后降序枚举(保证从高到低)最长回文子串长度,并进行数量累加,结果累乘,然后用快速幂求出值即可。
#include <bits/stdc++.h>
using namespace std;
long long p[2000020],t[2000020],maxn=0,id=0,ans=1,l=0,k=0,tj=0,tu=0,now=0,mod=19930726;
char stri[1000010],str[2000020];
long long power(long long a,long long p,long long m)
{
long long x=a,ans=1;
while(p)
{
if(p%2==1)ans=ans*x%m;
p/=2;
x=x*x%m;
}
return ans;
}
int main()
{
scanf("%lld%lld",&l,&k);
scanf("%s",stri);
str[0]='!';
for(int i=0;i<l;i++)
{
str[i*2+1]='#';
str[i*2+2]=stri[i];
}
str[l*2+1]='#';
l=l*2+1;
p[1]=1;maxn=0;id=0;
for(int i=1;i<=l;i++)
{
if(maxn>=i)p[i]=min(p[id*2-i],maxn-i);
else p[i]=1;
while(str[i-p[i]]==str[i+p[i]])p[i]++;
if(i+p[i]>maxn)maxn=i+p[i],id=i;
}
for(int i=1;i<=l;i++)p[i]--;
for(int i=1;i<=l;i++)t[p[i]]++;
for(int i=1000020;i>0;i--)
{
if(i%2==1)
{
tj+=t[i];
if(tj==0)continue;
if(now+tj<=k)ans=ans*power(i,tj,mod)%mod,now+=tj;
else
{
ans=ans*power(i,k-now,mod)%mod;
printf("%lld",ans);
return 0;
}
}
}
return 0;
}
例题 :
由翻转操作的定义,得知翻转后的字符串一定是长度为奇数的回文串,再次联想到 Manacher。由于回文串长度为奇数,所以不用在空隙处插入字符。
性质 :如果一个位置 ,其最长回文串延伸到字符串末尾,那么这个位置一定可以取到。
证明:
设字符串为 ,如果这个位置可以取到,最终翻转形成的串一定为 ( 为 前所有字符组成的字符串)。因为其最长回文串延伸到字符串末尾,设不算位置 的单边的回文部分为 ,则原字符串可以写作:()
最终翻转形成的串可以写作:
因为给出的字符串可以是最终翻转形成的字符串的前缀,对比二式发现给出的字符串一定为最终翻转形成的字符串的前缀,所以这个位置可以取到,结论得证。
性质 :在不属于性质 的前提下,如果一个位置 ,其最长回文串向左延伸到字符串第一个字符,向右延伸到可以取到的位置,那么这个位置一定可以取到。
证明:
由于不属于性质 ,所以必须回文串从头开始,否则无法保证回文部分之前的字符与之后的字符完全相等,所以要求最长回文串向左延伸到字符串第一个字符。
如果最长回文串向右延伸到可以取到的位置,那么相当于再翻转后的字符串是符合要求的,所以这个能翻转出符合要求的字符串的位置也是符合要求的。又因为最长回文串向左延伸到字符串第一个字符,所以不会对再翻出的符合要求的字符串造成影响,结论得证。
因此,我们可以结合上面两条性质,从右往左进行递推。对于每一个点,首先判断其是否符合性质 ,然后判断其是否符合性质 。同时为了方便计算性质 ,可以用一个数组记录每个位置是否可行。最后遍历一遍,输出可行的位置即可。
upd on 2024/8/9:更新了代码,原本的代码会被 hack。
#include <bits/stdc++.h>
using namespace std;
long long t,p[6000000],maxn=0,id=0,ans=0,book[6000000];
char s[6000000];
int main()
{
scanf("%d",&t);
while(t--)
{
scanf("%s",s+1);
s[0]='$';
long long l=strlen(s);
for(int i=1;i<=l;i++)p[i]=book[i]=0;
s[l+1]='#',l--,p[1]=1,maxn=0,id=0;
for(int i=1;i<=l;i++)
{
if(maxn>i)p[i]=min(p[id*2-i],maxn-i);
else p[i]=1;
while(s[i-p[i]]==s[i+p[i]])p[i]++;
if(i+p[i]>maxn)maxn=i+p[i],id=i;
}
for(int i=l;i>0;i--)
if(i+p[i]==l+1)book[i]=1;
else if(i==p[i])book[i]=book[i+p[i]-1];
for(int i=1;i<=l;i++)
if(book[i])printf("%d ",i);
printf("\n");
}
return 0;
}
后记
算法只是工具,现在很少直接考单纯的算法。Manacher 的题目重要的不是 Manacher 算法本身,而是其后的思维难度。——教练
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
· SQL Server 2025 AI相关能力初探