【知识点】Manacher算法详解

Manacher算法

算法简介

$Manacher$ 算法，即“马拉车”算法，是一种高效（$O(n)$）的求最长回文子串的算法。相比于 $KMP$ ，$Manacher$ 也许更好理解一些。

算法原理

对于传统的暴力解法，求最长回文子串的方式应该是对于每个位置 $i$ ，向两边“扩大”以寻找回文子串，再记录答案。易证，此解法时间复杂度为 $O(n^2)$。

众所周知，每一个毒瘤算法都有一个暴力的开头。

$Manacher$ 算法首先要对原字符串进行处理。因为回文串分为两种，“奇回文”和“偶回文”：

"abcba"
"abba"

首先，在每两个字符之间放入一个没有出现在原串的字符，如 $\mathtt{'\#'}$ ；接着，将字符串的两边插入另外两个不同的，且没有出现在原串的字符，如 $\mathtt{'@'}$ 和 $\mathtt{'\$'}$ 。操作结果如下：

"@a#b#b#a$"
"@a#b#c#b#a$"

神奇的事情发生了，“奇回文”和“偶回文”都转化成了“奇回文”。同时，在判定回文串的过程中也不用判边界了，因为修改后字符串边界字符不一样。

除此之外， $Manacher$ 算法还引入了一个数组 $p$ ， $p_i$ 表示以位置 $i$ 为中心的“最长回文半径”。对于字符串 $\mathtt{"@\#a\#b\#b\#a\#d\#c\#a\#c\#d\#a\#\$"}$ 如表所示:

$i$	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22
$s_i$	@	#	a	#	b	#	b	#	a	#	d	#	c	#	a	#	c	#	d	#	a	#	$
$p_i$	1	1	2	1	2	3	2	1	2	1	2	1	2	1	6	1	2	1	2	1	2	1	1

显然，最终答案就是 $max\{p_i-1\}$ 。那么 $Manacher$ 算法就讲完了……等等， $p$ 数组怎么求？

算法过程

推荐阅读~

首先，看下图：

引入两个变量， $mx$ 和 $id$ ， $mx$ 表示以 $id$ 为中心点的最大回文子串右边界。

假设现在要求 $p_i$ ，那么就有：

if(i<mx)
    p[i]=min(p[id*2-i],mx-i);

这样就可以加快速度。但是……为什么？为什么为什么？？？

设 $i'=id*2-i$ ，也就是说，$i'$ 是 $i$ 关于 $id$ 的对称点。因为是从前往后循环， $p_{i'}$是已知的。下面开始分类讨论：

若 $p_{i'}>mx-i$ ，可得以 $i'$ 为中心，以 $mx$ 的对称点 $mx'$ 到 $i'$ 的距离为半径形成的回文字符串是存在的，并且 $id$ 到 $mx'$ 与 $id$ 到 $mx$ 一一对应，所以 $mx$ 是 $i$ 目前可以更新到的最大回文半径；
若 $p_{i'}<mx-i$ ，也就是 $i'$ 的回文半径小于 $mx'$ 到 $i'$ 的距离，可得 $p_i=p_{i'}$ 。

于是就有了你看到的反人类代码。

完整代码

int manacher(string &s_src)
{
    /*
     * @params s_src为源字符串，s为预处理后的字符串
     */
      string s="@";
    for(auto &ch: s_src)
    {
        s.push_back('#');
        s.push_back(ch);
    }
    s+="#$";
    int id,mx=0,res=0;
    for(int i=1;i<s.size()-1;i++)
    {
        if(i<=mx)
            p[i]=min(p[id*2-i],mx-i);
        while(s[i-p[i]]==s[i+p[i]])
            p[i]++;
        if(i+p[i]>mx)
            id=i,mx=i+p[i]-1;
        res=max(res,p[i]-1);
    }
    return res;
}

posted @ 2020-08-25 20:06 ExplodingKonjac 阅读(519) 评论(0) 收藏举报

刷新页面返回顶部

菜鸡 EK 的鸟窝

因为我是一个蒟蒻，所以您逗留在此博客期间会一直被膜