sayhitrue

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

回文串定义:“回文串”是一个正读和反读都一样的字符串,比如“level”或者“noon”等等就是回文串。回文子串,顾名思义,即字符串中满足回文性质的子串。

经常有一些题目围绕回文子串进行讨论,比如POJ3974最长回文,求最长回文子串的长度。朴素算法是依次以每一个字符为中心向两侧进行扩展,显然这个复杂度是O(N^2)的,关于字符串的题目常用的算法有KMP后缀数组AC 自动机,这道题目利用扩展KMP可以解答,其时间复杂度也很快O(N*logN)。但是,今天笔者介绍一个专门针对回文子串的算法,其时间复杂度为O(n),这就是manacher 算法。

大家都知道,求回文串时需要判断其奇偶性,也就是求aba 和abba 的算法略有差距。然而,这个算法做了一个简单的处理,很巧妙地把奇数长度回文串与偶数长度回文串统一考虑,也就是在每个相邻的字符之间插入一个分隔符,串的首尾也要加,当然这个分隔符不能再原串中出现,一般可以用‘#’或者‘$’等字符。例如:

原串:abaab
新串:#a#b#a#a#b#

这样一来,原来的奇数长度回文串还是奇数长度,偶数长度的也变成以‘#’为中心奇数回文串了。
接下来就是算法的中心思想,用一个辅助数组P 记录以每个字符为中心的最长回文半径,也就是P[i]记录以Str[i]字符为中心的最长回文串半径。P[i]最小为1,此时回文串为Str[i]本身。
我们可以对上述例子写出其P 数组,如下

新串: # a # b # a # a # b #
P[] : 1 2 1 4 1 2 5 2 1 2 1

我们可以证明P[i]-1 就是以Str[i]为中心的回文串在原串当中的长度。
证明:
1、显然L=2*P[i]-1 即为新串中以Str[i]为中心最长回文串长度。
2、以Str[i]为中心的回文串一定是以#开头和结尾的,例如“#b#b#”或“#b#a#b#”所以L 减去最前或者最后的‘#’字符就是原串中长度的二倍,即原串长度为(L-1)/2,化简的P[i]-1。得证。 依次从前往后求得P 数组就可以了,这里用到了DP(动态规划)的思想, 也就是求P[i] 的时候,前面的P[]值已经得到了,我们利用回文串的特殊性质可以进行一个大大的优化。

void newStr(const string &s, string &n_s)
{
	n_s.push_back('$');
	n_s.push_back('#');
	for (auto i : s)
	{
		n_s.push_back(i);
		n_s.push_back('#');
	}
}

为了防止求P[i]向两边扩展时可能数组越界,我们需要在数组最前面和最后面加一个特殊字符,令P[0]=‘$’最后位置默认为‘\0’不需要特殊处理。此外,我们用MaxId 变量记录在求i 之前的回文串中,延伸至最右端的位置,同时用id 记录取这个MaxId 的id 值。通过下面这句话,算法避免了很多没必要的重复匹配。

#include<iostream>
#include <string>
#include <math.h>
#include <map>
#include <set>
#include <vector>
#include<algorithm>
#include <functional>
using namespace std;
#define min(x, y) ((x)>(y))?y:x
void newStr(const string &s, string &n_s)
{
	n_s.push_back('$');
	n_s.push_back('#');
	for (auto i : s)
	{
		n_s.push_back(i);
		n_s.push_back('#');
	}
}
int Manacher(const string &s, string &pa)
{
	string n_s;
	int id = 0, maxid = 0, ans = 1, pos = 1;
	newStr(s, n_s);
	auto n = n_s.length();
	vector<int> p(n, 1);//初始化全部为1,一定要
	for (auto i = 2; i < n; ++i)
	{
		if (maxid > i)
			p[i] = min(p[2 * id - i], maxid - i + 1);//方法重点
                //else  p[i] = 1;//上面没初始化这里就要写
		//while ((p[i] + i) < n&&n_s[p[i] + i] == n_s[i - p[i]])
		//	++p[i];
		for (; (p[i] + i) < n&&n_s[p[i] + i] == n_s[i - p[i]]; ++p[i]);
		if ((p[i] + i-1) > maxid)
		{
			maxid = p[i] + i-1;
			id = i;
		}
		if (p[i] > ans)
		{
			ans = p[i];
			pos = i;
		}
			
	}
	pa.clear();
	for (int i = pos - ans + 1; i < pos + ans; ++i) //貌似只能输出相等长度的第一个
		if (n_s[i] != '#')
			pa.push_back(n_s[i]);
	return ans - 1;
}
int main()
{
	int n;
	string s, palindrome;
	vector<int> len;
	vector<string> pa;
	cin >> n;
	for (int i = 0; i < n; ++i)
	{
		cin >> s;
		len.push_back(Manacher(s, palindrome));
		pa.push_back(palindrome);
	}
	for (int i = 0; i < n; ++i)
	{
		cout << len[i] << endl;
		cout << pa[i] << endl;
	}
	system("pause");
}
posted on 2016-04-08 19:38  sayhitrue  阅读(201)  评论(0编辑  收藏  举报