2013长春网赛1005 hdu 4763 Theme Section(kmp应用)

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4763

题意:给出一个字符串,问能不能在该串的前中后部找到相同的子串,输出最长的字串的长度。

分析:kmp的next[]数组应用。

next[i]=k表示在位置i之前有k个字符与字符串前k个字符相同,利用这个性质,先求出next[]数组,注意next[len]也要求出来,next[i]就表示字符串的后部与前部相同的长度,这样就只需找有没有中部就可以了。在next[i]到len-next[i]之间找有没有和next[i]相同的值就行了,找到就表示有中部,否则没有,这时i=next[i],然后继续找有没有中部,一直到next[i]==0为止。

之前的做法是错的,因为题目要求前缀,中缀,后缀不能出现重叠,之前的做法会导致3个错误:

1.可能会导致求出来的前缀和中缀重叠导致错误;

2.在next[i]到len-next[i]中间可能出现长度与前缀相同但是字符不一样的字串,比如:aaaaabbbbaaaa,这样用之前的做法会得出错误的答案;

3.如果前缀和中缀是连续的,那么next[len]就有可能是前缀和中缀的总长度和了,这样也会错误。

所以不能仅仅依靠next[]数组来求解

正确的做法是:

在next[i]到len-next[i]之间用kmp匹配前缀,如果匹配成功,则说明能找到中部,否则不能,i=next[i]然后继续查找中部,直到next[i]==0即可.

根据next[]数组的性质,循环的次数不超过3次,因为如果后部和前部不相同的话,next[i]==0,这样很快就可以跳出循环了。

还可以加个优化:前中后部字串的长度最多为len/3,如果next[i]>len/3的话就可以直接跳过查找中部,进入下一次循环了。但是优化不大,因为循环次数非常少。

AC代码:

 1 #include<cstdio>
 2 #include<cstring>
 3 const int N=1000000+5;
 4 int next[N];
 5 char s[N],c[N],d[N];
 6 void get_next(char s[])
 7 {
 8     int len=strlen(s);
 9     int i=0;
10     int j=-1;
11     next[0]=-1;
12     while(i<=len)    //注意要==
13     {
14         if(j==-1||s[i]==s[j])
15         {
16             i++;
17             j++;
18             next[i]=j;
19         }
20         else
21             j=next[j];
22     }
23 }
24 int kmp(char t[],char s[])
25 {
26     int i,j,k,m,n;
27     m=strlen(s);
28     n=strlen(t);
29     i=j=k=0;
30     while(i<m&&j<n)
31     {
32         if(j==-1 || t[j]==s[i])
33         {
34             i++;
35             j++;
36         }
37         else
38             j=next[j];
39     }
40     if(j>=n)
41         return 1;
42     else
43         return 0;
44 }
45 int main()
46 {
47     int t,j,k;
48     scanf("%d",&t);
49     while(t--)
50     {
51         scanf("%s",s);
52         get_next(s);
53         int len=strlen(s);
54         int i=next[len];
55         int flag=0;
56         while(i>0)
57         {
58             while(i>len/3)
59                 i=next[i];
60             if(i<=0)
61                 break;
62             /********************************
63             错误解法:
64             for(j=i;j<=len-i;j++)   //找中部
65                 if(next[j]==i)
66                 {
67                     flag=1;
68                     break;
69                 }
70             ********************************/
71             for(k=0,j=0;j<i;j++)
72                 c[k++]=s[j];
73             c[k]='\0';
74             for(k=0;j<len-i;j++)
75                 d[k++]=s[j];
76             d[k]='\0';
77             flag=kmp(c,d);
78             if(flag==1)    //找到了
79                 break;
80             else
81                 i=next[i];    //找不到,循环继续
82         }
83         if(flag)
84             printf("%d\n",i);
85         else
86             printf("0\n");
87     }
88     return 0;
89 }
View Code

 

posted on 2013-10-03 16:15  jumpingfrog0  阅读(208)  评论(0编辑  收藏  举报

导航