动物园|KMP|题解

[NOI2014] 动物园

题目描述

近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。

某天,园长给动物们讲解 KMP 算法。

园长:“对于一个字符串 S,它的长度为 L。我们可以在 O(L) 的时间内,求出一个名为 next 的数组。有谁预习了 next 数组的含义吗?”

熊猫:“对于字符串 S 的前 i 个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作 next[i]。”

园长:“非常好!那你能举个例子吗?”

熊猫:“例 Sabcababc,则 next[5]=2。因为S的前5个字符为 abcabab 既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出 next[1]=next[2]=next[3]=0next[4]=next[6]=1next[7]=2next[8]=3。”

园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在 O(L) 的时间内求出 next 数组。

下课前,园长提出了一个问题:“KMP 算法只能求出 next 数组。我现在希望求出一个更强大 num 数组一一对于字符串 S 的前 i 个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作 num[i]。例如 Saaaaa,则 num[4]=2。这是因为S的前 4 个字符为 aaaa,其中 aaa 都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而 aaa 虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1]=0,num[2]=num[3]=1,num[5]=2。”

最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?

特别地,为了避免大量的输出,你不需要输出 num[i] 分别是多少,你只需要输出所有 (num[i]+1) 的乘积,对 109+7 取模的结果即可。

输入格式

1 行仅包含一个正整数 n,表示测试数据的组数。
随后 n 行,每行描述一组测试数据。每组测试数据仅含有一个字符串 SS 的定义详见题目描述。数据保证 S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

输出格式

包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 109+7 取模的结果。输出文件中不应包含多余的空行。

样例 #1

样例输入 #1

3
aaaaa
ab
abcababc

样例输出 #1

36
1
32

提示

测试点编号 约定
1 n5,L50
2 n5,L200
3 n5,L200
4 n5,L10,000
5 n5,L10,000
6 n5,L100,000
7 n5,L200,000
8 n5,L500,000
9 n5,L1,000,000
10 n5,L1,000,000
题目链接

这个题确实能够加深自己对KMP的理解.

题意是比较奇怪的,它让我们求一个串的所有前缀不重叠的border个数之积.
思路比较好想,先求出所有的前缀函数,然后让它跳转到第一个比它长度的二分之一小的border处.
然后将这个border的border个数传给我们当前需要知道结果的串,即为当前串的结果.
但是很遗憾的是这样写会T,因为它可能会安排像aaaaaaaaaa...这样的数据.
那我们现在按前缀函数的规则一个一个进行跳转,那必然会T.
所以说就需要有优化方案.
在我们求前缀函数的过程中我们就可以求出每个串的border个数,同时我们知道比当前串长的二分之一小的最大border的border个数是答案.
所以我们求答案时可以每一次都保证当前的border的末位没有跳转到下一个串长的二分之一处.
这样我们的跳转就减少大半,从上一个串的最长合法border开始尝试扩展border,若两点的字符匹配且border长度满足条件,则该border合法.
那么框架就出来了,剩下的就是代码了.
注:有一些对于KMP的写法的新理解.
首先以前的模板是这样的:

void get_pre()
{
	for(int i=1;i<len;++i)
	{
		int j=pi[i-1];
		while((s[i]^s[j])&&j)j=pi[j-1];
		if(s[i]^s[j])pi[i]=j;
		else pi[i]=j+1;
	}
}

但是事实上我们每一次都要用到前面的pi值且我们每一次进行转移的j及j-1分别表示border长度以及对于border的末位.
所以可以更改为:

void get_pre()
{
	for(int i=1,j=0;i<len;++i)
	{//这里让长度为j的border的pi值对应j-1位,每次转移的时候直接用j=pi[j]即可.
		while(j&&(s[j]^s[i]))j=pi[j];
		j+=(s[i]==s[j]);
		pi[i+1]=j;
	}
}

这种模板更会灵活一些.

正解:

#include<bits/stdc++.h>
#define ll long long
using namespace std;

const int N=1e6+500,mod=1e9+7;
int n,num[N],pi[N],len;
ll ans;
char s[N];
void get_pre()
{
	num[1]=1;
	for(int i=1,j=0;i<len;++i)
	{
		while(j&&(s[j]^s[i]))j=pi[j];
		j+=(s[i]==s[j]);
		pi[i+1]=j;
		num[i+1]=num[j]+1;
	}
}
void get_num()
{
    for(int i=1,j=0;i<len;++i)
    {
        while(j&&(s[i]^s[j]))j=pi[j];
    	j+=(s[i]==s[j]);
        while((j<<1)>i+1) j=pi[j];
        ans=(ans*(num[j]+1))%mod;
    }
}
void init()
{
	scanf("%d",&n);
	while(n)
	{
		memset(num,0,sizeof(num));
		ans=1;
		scanf("%s",s);
		len=strlen(s);
//		printf("%d\n",len);
		get_pre();get_num();
		printf("%lld\n",ans);
		--n;
	}
}
int main()
{
	init();
	return 0;
 } 
posted @   SLS-wwppcc  阅读(19)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示