求某一字符串的最长重复子串
要求:给定一个字符串,求该字符串的最长重复子串,最长重复子串是指在一个主串中,重复子串中最长的那一个,如:abcdefadef 则答案为:def。
预备知识:要解决此题,要用到后缀数组(用指针数组来表示)
思路:先用后缀数组存储主串的每个子串的后缀,然后对后缀数组中的元素进行排序。最后通过扫描相邻两个数组中的后缀来判断最长的子串
基于此思路代码如下:
#include <stdio.h> #include <stdlib.h> #include <string.h> #include<iostream> using namespace std; #define MAXCHAR 5000 //最长处理5000个字符 char c[MAXCHAR], *a[MAXCHAR]; int comlen( char *p, char *q ){ int i = 0; while( *p && (*p++ == *q++) ) ++i; return i; } int pstrcmp( const void *p1, const void *p2 )//void* 类型的指针为通用指针,可以指向任意类型的地址值,但对于一个已获值的void型指针,对它在进行处理,如输出或传递指针值,则必须进行显示类型转换
{ return strcmp( *(char* const *)p1, *(char* const *)p2 );//注意在此处将p1强制转换为char**类型说明回调函数传入的参数为char**类型 } int main( ){ char ch; int n=0; int i, temp; int maxlen=0, maxi=0; printf("Please input your string:\n"); while( (ch=getchar())!='\n' ){ a[n]=&c[n]; c[n++]=ch; } c[n]='\0'; qsort( a, n, sizeof(char*), pstrcmp );//各参数:1 待排序数组首地址 2 数组中待排序元素数量 3 各元素的占用空间大小 4 指向函数的指针 for(i=0; i<n-1; ++i ){ temp=comlen( a[i], a[i+1] ); if( temp>maxlen ){ maxlen=temp;//maxlen用来记录最大重复子串的长度 maxi=i;//maxi用来记录最大重复子串的后缀数组的下标 } } cout<<"最长重复子串的长度为"<<maxlen<<' '<<"最长重复子串为:"<<endl; for(int i=0;i<maxlen;i++) { cout<<a[maxi][i]; } cout<<endl; return 0; }程序运行结果如下: