求某一字符串的最长重复子串

要求:给定一个字符串,求该字符串的最长重复子串,最长重复子串是指在一个主串中,重复子串中最长的那一个,如:abcdefadef 则答案为:def。

预备知识:要解决此题,要用到后缀数组(用指针数组来表示)

思路:先用后缀数组存储主串的每个子串的后缀,然后对后缀数组中的元素进行排序。最后通过扫描相邻两个数组中的后缀来判断最长的子串

基于此思路代码如下:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include<iostream>
using namespace std;
#define MAXCHAR 5000 //最长处理5000个字符

char c[MAXCHAR], *a[MAXCHAR];

int comlen( char *p, char *q ){
    int i = 0;
    while( *p && (*p++ == *q++) )
        ++i;
    return i;
}
int pstrcmp( const void *p1, const void *p2 )//void* 类型的指针为通用指针,可以指向任意类型的地址值,但对于一个已获值的void型指针,对它在进行处理,如输出或传递指针值,则必须进行显示类型转换
{
    return strcmp( *(char* const *)p1, *(char* const *)p2 );//注意在此处将p1强制转换为char**类型说明回调函数传入的参数为char**类型
}
int main(  ){
    char ch;
    int  n=0;
    int  i, temp;
    int  maxlen=0, maxi=0;
    printf("Please input your string:\n");
    while( (ch=getchar())!='\n' ){
        a[n]=&c[n];
        c[n++]=ch;
    }
    c[n]='\0';
    qsort( a, n, sizeof(char*), pstrcmp );//各参数:1 待排序数组首地址 2 数组中待排序元素数量 3 各元素的占用空间大小 4 指向函数的指针
    for(i=0; i<n-1; ++i ){
        temp=comlen( a[i], a[i+1] );
        if( temp>maxlen ){
            maxlen=temp;//maxlen用来记录最大重复子串的长度
            maxi=i;//maxi用来记录最大重复子串的后缀数组的下标
        }
    }
    cout<<"最长重复子串的长度为"<<maxlen<<' '<<"最长重复子串为:"<<endl;
	for(int i=0;i<maxlen;i++)
	{
		cout<<a[maxi][i];
	}
	cout<<endl;
    return 0;
}
程序运行结果如下:



posted on 2016-03-11 14:24  海南一哥  阅读(491)  评论(0编辑  收藏  举报

导航