回文字符串问题
回文字符串问题
一、动态规划法
定义boolean型的 p[i][j],为 Si 到 Sj 是否为回文,true 说明 Si 到 Sj 是回文字符串
则有,P[i,j] = (P[i + 1, j - 1] && Si ==Sj)
初始条件p[i, i] = true, p[i,i+1] = Si==Si+1
动态规划的思想是首先判断相邻的字符串是否是回文,然后继续判断连续的三个字符是否是回文,然后是四个,…,直到判断完整个字符串
时间复杂度O(n2),空间复杂度O(n2)
代码实现:
publicstaticString longestPalindromeDP(String str){
if(str ==null|| str.length()<=0)returnnull;
int len = str.length();
int startIndex =0;
int maxLen =1;
boolean[][] p =newboolean[len][len];
for(int i =0; i < len; i++){
for(int j =0; j < len; j++){
if(i == j){
p[i][j]=true;
continue;
}
p[i][j]=false;
}
}
for(int i =0; i < len -1; i++){
//相邻的相同
if(str.charAt(i)== str.charAt(i+1)){
p[i][i+1]=true;
startIndex = i;
maxLen =2;
}
}
for(int i =3; i <= len; i++){
for(int j =0; j < len - i +1; j++){
//当前判断回文长度为i,起始位置为j
int currLast = j + i -1;
if(str.charAt(j)== str.charAt(currLast)&& p[j+1][currLast-1]){
p[j][currLast]=true;
startIndex = j;
maxLen = i;
}
}
}
return str.substring(startIndex, startIndex+maxLen);
}
二、中心检测法
回文字符串的特点是以中心对称,从0开始依次遍历字符串,每次以选取的点为中心,向两边检测,判断是否符合回文字符串。
时间复杂度O(n2),空间复杂度O(1)
publicstaticString longestPalindromeCerter(String str){
if(str ==null|| str.length()<=0)returnnull;
String longest = str.substring(0,1);
for(int i =0; i < str.length()-1; i++){
//获得以i为中心的回文字符串
String s = getPalindromeCerter(str, i, i);
if(s.length()> longest.length()){
longest = s;
}
//获得以i和i+1为中心的回文字符串
s = getPalindromeCerter(str, i, i +1);
if(s.length()> longest.length()){
longest = s;
}
}
return longest;
}
//获得以i,j为中心的回文字符串i==j时,就是以i为中心的回文字符串
privatestaticString getPalindromeCerter(String str,int i,int j){
while(i >=0&& j < str.length()&& str.charAt(i)== str.charAt(j)){
i --;
j ++;
}
return str.substring(i +1, j);
}
三、添加辅助标志
首先我们把字符串S改造一下变成T,改造方法是:在S的每个字符之间和S首尾都插入一个”#”。这样做的理由你很快就会知道。
例如,S=”abaaba”,那么T=”#a#b#a#a#b#a#”。
想一下,你必须在以Ti为中心左右扩展才能确定以Ti为中心的回文长度d到底是多少。(就是说这一步是无法避免的)
为了改进最坏的情况,我们把各个Ti处的回文半径存储到数组P,用P[i]表示以Ti为中心的回文长度。那么当我们求出所有的P[i],取其中最大值就能找到最长回文子串了。
对于上文的示例,我们先直接写出所有的P研究一下。
i = 0 1 2 3 4 5 6 7 8 9 A B C
T = # a # b # a # a # b # a #
P = 0 1 0 3 0 1 6 1 0 3 0 1 0
显然最长子串就是以P[6]为中心的”abaaba”。
你是否发现了,在插入”#”后,长度为奇数和偶数的回文都可以优雅地处理了?这就是其用处。
现在,想象你在”abaaba”中心画一道竖线,你是否注意到数组P围绕此竖线是中心对称的?再试试”aba”的中心,P围绕此中心也是对称的。这当然不是巧合,而是在某个条件下的必然规律。我们将利用此规律减少对数组P中某些元素的重复计算。
我们来看一个重叠得更典型的例子,即S=”babcbabcbaccba”。
上图展示了把S转换为T的样子。假设你已经算出了一部分P。竖实线表示回文”abcbabcba”的中心C,两个虚实线表示其左右边界L和R。你下一步要计算P[i],i围绕C的对称点是i’。有办法高效地计算P[i]吗?
我们先看一下i围绕C的对称点i’(此时i’=9)。
据上图所示,很明显P[i]=P[i’]=1。这是因为i和i’围绕C对称。同理,P[12]=P[10]=0,P[14]=P[8]=0。
现在再看i=15处。此时P[15]=P[7]=7?错了,你逐个字符检测一下会发现此时P[15]应该是5。
为什么此时规则变了?
如上图所示,两条绿色实线划定的范围必定是对称的,两条绿色虚线划定的范围必定也是对称的。此时请注意P[i’]=7,超过了左边界L。超出的部分就不对称了。此时我们只知道P[i]>=5,至于P[i]还能否扩展,只有通过逐个字符检测才能判定了。
在此例中,P[21]≠P[9],所以P[i]=P[15]=5。
我们总结一下上述分析过程,就是这个算法的关键部分了。
if P[ i’ ] < R – i,
then P[ i ] ← P[ i’ ]
else P[ i ] ≥ R - i. (此时要穿过R逐个字符判定P[i]).
很明显C的位置也是需要移动的,这个很容易:
如果i处的回文超过了R,那么就C=i,同时相应改变L和R即可。
每次求P[i],都有两种可能。如果P[i‘] < R – i,我们就P[i] = P[i’]。否则,就从R开始逐个字符求P[i],并更新C及其R。此时扩展R(逐个字符求P[i])最多用N步,而求每个C也总共需要N步。所以时间复杂度是2*N,即O(N)。
时间复杂度O(n),空间复杂度O(n)
实现:
/**
* 通过添加辅助标识,来获得最长回文子串
* @param str
* @return
*/
publicstaticString longestPalindromeAddTag(String str){
if(str ==null|| str.length()<=0)returnnull;
StringBuilder sb = addTag(str);
int[] p =newint[sb.length()];//以i为中心的,左右半边的回文子串长度(包括#)
p[0]= p[sb.length()-1]=0;
int center =0;int r =0;
for(int i =1; i < sb.length()-1; i++){
int i_mirror = center -( i - center);
int diff = r - i;
if(i_mirror>=0){
if(p[i_mirror]< diff) p[i]= p[i_mirror];
else{
center = i;
p[i]= diff;
int pre = i - p[i]-1;//往前
int after = i + p[i]+1;//往后
while(pre >=0&& after < sb.length()&&
sb.charAt(pre)== sb.charAt(after)){
p[i]++;
pre --;//往前
after ++;//往后
}
r = i + p[i];//当前中心的右边缘
}
}else{
center = i;
p[i]=0;
int pre = i - p[i]-1;//往前
int after = i + p[i]+1;//往后
while(pre >=0&& after < sb.length()&&
sb.charAt(pre)== sb.charAt(after)){
p[i]++;
pre --;//往前
after ++;//往后
}
r = i + p[i];//当前中心的右边缘
}
}
int maxLen =0;
int index =0;
for(int i =0; i < sb.length(); i++){
if(p[i]> maxLen){
maxLen = p[i];
index = i;
}
}
int start =(index >>1)-(maxLen >>1);
intlast=(index >>1)+(maxLen >>1);
if((index &0x01)==1)last++;
return str.substring(start,last);
}
/**
* 向字符串中插入#,如 ab,则返回 #a#b#
* @param str
* @return
*/
privatestaticStringBuilder addTag(String str){
StringBuilder sb =newStringBuilder();
sb.append('#');
for(int i =0; i < str.length(); i++){
sb.append(str.charAt(i));
sb.append('#');
}
return sb;
}
四、字符串变成回文字符串需要添加的字符数
f(i,j)表示s[i..j]变为回文串需要添加的最少字符数。
f(i,j)=0if i>=j
f(i,j)=f(i+1,j-1)if i<j and s[i]==s[j]
f(i,j)=min(f(i,j-1),f(i+1,j))+1if i<j and s[i]!=s[j]
实现:
/**
* 添加多少字符串使字符串变为回文串
* @param str
* @return
*/
publicstaticint addTobePalindrome(String str){
if(str ==null|| str.length()<=0)return0;
int len = str.length();
int[][] p =newint[len][len];
for(int i =0; i < len; i++){
for(int j =0; j < len; j++){
p[i][j]=0;
}
}
for(int i =2; i <= len; i++){
for(int j =0; j < len - i +1; j++){
int currLast = j + i -1;
if(str.charAt(j)== str.charAt(currLast)){//判断s[i...j]需要添加的字符个数
p[j][currLast]= p[j+1][currLast-1];
}else{
p[j][currLast]=1+(p[j][currLast -1]< p[j+1][currLast]? p[j][currLast -1]: p[j+1][currLast]);
}
}
}
return p[0][len-1];
}
参考:
[1]http://www.cnblogs.com/bitzhuwei/p/Longest-Palindromic-Substring-Par-I.html
[2]http://www.cnblogs.com/bitzhuwei/p/Longest-Palindromic-Substring-Part-II.html