动物园

题目描述

近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。

某天,园长给动物们讲解KMP算法。

园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”

熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”

园长:“非常好!那你能举个例子吗?”

熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”

园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。

下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”

最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出1,000,000,007取模的结果即可。

输入

第1行仅包含一个正整数n ,表示测试数据的组数。随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

输出

包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。

样例输入

3
aaaaa
ab
abcababc

样例输出

36  //(0+1)*(1+1)*(1+1)*(2+1)*(2+1)
1  //(0+1)*(0+1)
32

 

本题大意:求字符串的每一位截至的前缀和后缀的长度,这里要求前缀和后缀不能重叠,并按规则计算出num[]数组值。

sol:先求next数组,对于next[i],以i结尾的子串的前缀和后缀是可以重叠的,本题求的num数组,要求前缀和后缀不能重叠,怎样做到不重叠呢,也就是前缀长度只能<=总长度的一半。求出next数组后,我们发现如果next[i]和i之间连一条边,就构成了一棵树。所求的num[i]就是这条链上0到next[i]的所有点,看哪些值是<=i/2的。由于low_bound()函数是找一个有序序列中大于等于某值的位置的,于是我们用up_bound()来找严格大于的,找到那个位置后,位置号-1,就是num[i]的值了。如S="abaabaa",构造的fail树如下:

  如i=6,next[6]=3,我们从[0,1,3,6]这条链中,找0到next[6]=3中其值<=6/2的,用up_bound()找到,[0,1,3,6]的第4个位置,是严格大于6/2的,num[6]为4-1=3,及前3个数[0,1,3]满足条件。

再如i=7,next[7]=4,0到7的这条链为[0,1,4,7],找到第3个位置的4,已严格大于7/2了,num[7]为3-1=2,及前两个[0,1]满足条件。

代码如下:

 1 #include <bits/stdc++.h>
 2 #include <cstring>
 3 #include <algorithm>
 4 #define N 1000010
 5 using namespace std;
 6 int fail[N] , num[N] , head[N] , to[N] , next[N] , cnt , sta[N] , top;
 7 char str[N];
 8 void add(int x , int y)
 9 {
10     to[++cnt] = y , next[cnt] = head[x] , head[x] = cnt;
11 }
12 void dfs(int x)
13 {
14     int i;
15     sta[++top] = x; //将编号为x的号进栈
16     for(i = head[x] ; i ; i = next[i])
17     {
18      
19      num[to[i]] = upper_bound(sta + 1 , sta + top + 1 , to[i] >> 1) - sta - 1 ;
20      //求出to[i]这个点,所在的栈中,有多少值是小于它的一半的。
21      //upper_bound是找第一个严格大于某个元素的位置,减去1后,也就是找有多少个数是小于等于某个元素的了
22      dfs(to[i]);
23     } 
24     sta[top -- ] = x;
25 }
26 int main()
27 {
28     int T;
29     scanf("%d" , &T);
30     while(T -- )
31     {
32         int n , i = 0 , j = -1;
33         long long ans = 1;
34         memset(head , 0 , sizeof(head)) , cnt = 1;
35         scanf("%s" , str) , n = strlen(str);
36         fail[0] = -1;
37         while(i < n)
38         {
39             while(~j && str[j] != str[i]) j = fail[j];
40             fail[++i] = ++j;
41         }
42        // for (int i=1;i<=n;i++)
43          //  cout<<i<<"    "<<fail[i]<<endl;
44         for(i = 1 ; i <= n ; i ++ ) //连一条边从fail[i]到i
45             add(fail[i] , i);
46         dfs(0);//从0号点开始,将其入栈,这样每个num[i]的值于少为1
47         for(i = 1 ; i <= n ; i ++ )
48              ans = ans * num[i] % 1000000007;
49         printf("%lld\n" , ans);
50     }
51     return 0;
52 }

 

posted @ 2020-03-20 20:18  蘑菇JJ  阅读(127)  评论(0编辑  收藏  举报