字符串移位包含的问题

问题:给定两个字符串s1和s2,要求判断s2是否能够被通过s1做循环移位(rotate)得到的字符串包含。例如,S1=AABCD和s2=CDAA,返回true;给定s1=ABCD和s2=ACBD,返回false。

解法一:从题目中可以看出,我们可以使用最直接的方法对S1进行循环移动,再进行字符串包含的判断,从而遍历其所有的可能性。字符串循环移动,时间复杂度为O(n),字符串包含判断,采用普通的方法,时间复杂度为O(n*m),总体复杂度为O(n*n*m)。字符串包含判断,若采用KMP算法,时间复杂度为O(n),这样总体的复杂度为O(n*n)。若字符串的长度n较大,显然效率比较低。其中n为S1的长度,m为S2的长度。

#include<iostream>
using namespace std;
/*
  strstr函数说明 
  包含文件:string.h
  函数名: strstr
  函数原型:extern char *strstr(char *str1, char *str2);
  功能:从字符串str1中查找是否有字符串str2,如果有,从str1中的str2位置起,返回str1中str2起始位置的指针,如果没有,返回null。
  返回值:返回该位置的指针,如找不到,返回空指针。
*/
int rotate_conbine(char *src,char *dec)
{
    int len=strlen(src);
    for(int i=0;i<len;i++)
    {
        char tmp=src[0];
        for(int j=0;j<len-1;j++)
        {
            src[j]=src[j+1];
        }
        src[len-1]=tmp;
        if(strstr(src,dec)!=NULL)
            return 1;
    }
    return 0;
}
int main()
{
    char src[]="AABCD";
    char dec[]="CDAA";
    
    if(rotate_conbine(src,dec))
        printf("ok\n");
    else 
        printf("no\n");
    system("pause");
}

strstr函数的内部代码是这样的:

char *strstr( const char *s1, const char *s2 )   
{   
    if ( !(len2 = strlen(s2)) )   
        return (char *)s1;   
    for(;*s1;++s1)   
    {   
        if ( *s1 == *s2 && strncmp(s1,s2,len2)==0 )   
            return (char *)s1;   
    }   
    return NULL;   
}

解法二:我们也可以对循环移位之后的结果进行分析。
以S1 = ABCD为例,先分析对S1进行循环移位之后的结果,如下所示:
ABCD--->BCDA---->CDAB---->DABC---->ABCD……
假设我们把前面的移走的数据进行保留,会发现有如下的规律:
ABCD--->ABCDA---->ABCDAB---->ABCDABC---->ABCDABCD……
因此,可以看出对S1做循环移位所得到的字符串都将是字符串S1S1的子字符串。如果S2可以由S1循环移位得到,那么S2一定在S1S1上,这样时间复杂度就降低了。

#include<iostream>
using namespace std;

int rotate_conbine(string src,string des)
{
    string tmp = src;
    src=src+tmp;
    if(strstr(src.c_str(),des.c_str())==NULL)
    {
        return 0;   
    }
    return 1; 
}
/*
int doubel_src_conbine(char *src, char *des){  
    int len = strlen(src);  
    char *temp = (char *)malloc((2*len+1)*sizeof(char));  
    char *p = temp;  
    char *s = src;  
    while(*s != '\0'){  
        *p = *s;  
        p++;  
        s++;  
    }  
    s = src;  
    while(*s != '\0'){  
        *p = *s;  
        p++;  
        s++;  
    }  
    p++;  
    *p = '\0';  
    if(strstr(temp, des) != NULL)  
        return 1;  
    else  
        return 0;  
}  
*/
int main()
{
    char src[]="AABCD";
    char dec[]="CDAA";
    
    if(rotate_conbine(src,dec))
        printf("ok\n");
    else 
        printf("no\n");
    system("pause");
}

解法三:我们的想法是,在s1后面"虚拟"地接上一个s1,这个"虚拟的s1"并不占空间,但是仍然按照解法2的思路进行。那么,如何实现这个"虚拟的s1"呢?其实只要把s1的最后一个元素,再指回s1的第一个元素即可。这可以用取模运算实现。比如,元素s1[(d1+i) mod d1]其实就是那个“虚拟的s1”的第i个元素,这里 0<=i<=d1-1, d1是字符串s1的长度。

同理,指针也可以实现类似功能:

#include<iostream>
using namespace std;

int ptr_contain(char *src, char *des){
    char *p = NULL;
    char *q = NULL;
    char *r = NULL;
    p = q = src;
    r = des;
    char *tmp = NULL;
    while(*p != '\0' )
    {
        while (*p != *r)
            p++;
        tmp = p;
        tmp++;
        while(*(++r) != '\0')
        {
            if(*(++p) == '\0')
                p = q;
            if(*r != *p)
            { 
                r = des;
                p = tmp;
                break;
            }
        }
        if(*r == '\0')
            return 1;
    }
    return 0;
}
int main()
{
    char src[]="AABCBCD";
    char dec[]="CDAA";
    
    if(ptr_contain(src,dec))
        printf("ok\n");
    else 
        printf("no\n");
    system("pause");
}

解法三的优点:
1. 字符串长度较大时,效率依然较好;
2.不需要申请额外空间存储第二个s1

posted @ 2013-08-20 16:54  一枚程序员  阅读(5530)  评论(0编辑  收藏  举报