hdu3068-最长回文-马拉车(Manacher)算法
http://acm.hdu.edu.cn/showproblem.php?pid=3068
脑子转个弯总算看懂马拉车算法了。记录一下思路和模板。
马拉车算法是在O(n)的时间内求出最大回文子串。
一、变量和定义
为了对奇偶回文串统一处理,每个字符之间都加上一个字符,加上一个不会出现在原字符串的,
如"abba"变成"#a#b#b#a#";"aba"变成"#a#b#a#";无论是奇偶原串都变成了奇数新串,接下来对新串处理。
在一次遍历字符的过程中,变量名及意义
i:表示当前遍历到哪一个下标的字符
p[idx]:表示下标为idx的字符的回文半径,包括自身
id:目前遍历过程中能延展到最右的回文的中心点
mx:目前遍历过程中能延展到最右的下标位置,姑且称之为探测的最远长度
j:以id为中心的关于i对称的字符,在id的左边,已经遍历过了,p[j]已经确定了的
二、为何要记录每个遍历字符的回文半径呢?利用已有的信息为后面的遍历铺垫,否则就和中心扩展一样是O(n2)复杂度
1."abcecbd"加上'#'后变成"#a#b#c#e#c#b#d#"
下标 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
内容 # a # b # c # e # c # b # d #
p[i] 1 2 1 2 1 2 1 6 1 2 1 2 1 2 1
最长回文子串"#b#c#e#c#b#"的中心字符为e,下标为7,减去p[7]之后等于1,表示最长回文子串"bcecb"在原串"abcecbd"中的下标为1(从0算起)
2."abbc"加上'#'后变成"#a#b#b#c#"
下标 0 1 2 3 4 5 6 7 8
内容 # a # b # b # c #
p[i] 1 2 1 2 3 2 1 2 1
最长回文子串"#b#b#"的中心字符为#,下标为4,减去p[4]=3之后等于1,表示最长回文子串"bb"在原串"abbc"中的下标为1(从0算起)
3."aba"加上'#'后变成"#a#b#a#"
下标 0 1 2 3 4 5 6
内容 # a # b # a #
p[i] 1 2 1 4 1 2 1
最长回文子串"#a#b#a#"的中心字符为b,下标为3,减去p[3]=4之后等于-1,与前面不一致。原串最长回文子串应该是下标从0开始,则需要向右移动1位
4.在最左边加一个字符'$'(不会在原串中出现),则变成"$#a#b#a#"
下标 0 1 2 3 4 5 6 7
内容 $ # a # b # a #
p[i] 1 1 2 1 4 1 2 1
则最长回文子串"#a#b#a#"的中心字符为b,下标为4,减去p[3]=4之后等于0,与"aba"在"aba"的起始位置一致。
再回顾前2个例子
5."#a#b#c#e#c#b#d#"在首位加上'$'
下标 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
内容 $ # a # b # c # e # c # b # d #
p[i] 1 1 2 1 2 1 2 1 6 1 2 1 2 1 2 1
最长回文子串"#b#c#e#c#b#"的中心字符为e,下标为8,减去p[8]=6之后等于2,但是最长回文子串"bcecb"在原串"abcecbd"中的下标为1,除以2可以得到,对于上一个例子0没有影响,再通过另一个例子验证。
6."#a#b#a#"在首位加上'$'
下标 0 1 2 3 4 5 6 7 8 9
内容 $ # a # b # b # c #
p[i] 1 1 2 1 2 3 2 1 2 1
最长回文子串"#b#b#"的中心字符为#,下标为5,减去p[5]=3之后等于2,但是最长回文子串"bb"在原串"abbc"中的下标为1,除以2可以得到
7.经过多方尝试都能通过验证。
首位加上一个不相干的字符后,原串的最长回文子串起始位置=(新串的最长回文中心id-p[id])/2
三、算法过程
1.如果i在mx左边,则i在以id为中心的回文子串内部,则与j对称;以j为中心的回文,i必然也有,对于j的回文情况p[j],再分两种情况讨论
(1)i+p[j]使得i右边大于等于mx,即(i+p[j])>=mx,则p[i]取(mx-i)即可
(2)(i+p[j])<mx,则p[i]=p[j]
2.如果i再mx右边,则先设p[i]=1
3.暂定了p[i],仍需要中心扩展。(马拉车的精髓就在这里,一次性可能定了一个巨大的p[i],而不是每次都从1慢慢中心扩展,节省时间)
4.防止中心扩展时候某一边会越界,尾部也加个乱七八糟的字符堵住,例如'!'
#include<stdio.h> #include<iostream> #include<algorithm> #include<cstring> #include<math.h> #include<string> #include<map> #include<queue> #include<stack> #include<set> #include<ctime> #define ll long long #define inf 0x3f3f3f3f const double pi=3.1415926; using namespace std; int p[110000*2+5]; int Manacher(string s) { int ans=2; int id=1,mx=1; memset(p,0,sizeof(p)); int len=s.size(); for(int i=1;i<len;i++) { int j=2*id-i;///对称点 if(mx>i) ///i在已探测的范围内 { if(mx-i>=p[j]) p[i]=p[j]; else p[i]=mx-i; } else p[i]=1; ///暂定了p[i],还是有可能更大,中心扩展 while( s[ i+p[i] ] == s[ i-p[i] ] )///前后加入不相干字符,不会越界 p[i]++; if(i+p[i]>mx)///更新最右点和对应的id { id=i; mx=id+p[id]; } ans=max(ans,p[i]); } return ans-1; } int main() { ios::sync_with_stdio(false);//加速 string str,s; while(cin>>str) { s="$#"; int len=str.size(); for(int i=0;i<len;i++) { s += str[i]; s += "#"; } s=s+"!"; cout<<Manacher(s)<<endl; } return 0; }
运用了马拉车算法,本题还有2个可能出现的坑
- 坑1:如果同c++的string输入字符串,需要加速
- 坑2:string的拼接:str =str+ "a"加的运算产生的是一个新的对象,再把结果返回,而str += "a" 涉及到的应该是对象的引用,操作之后直接返回引用,避免了产生新的对象。因此,两者的性能有一定的差距。+=的写法更快。
真的是被坑得神不知鬼不觉,T了十几发才找到错误