洛谷题单指南-字符串-P3435 [POI2006] OKR-Periods of Words
原题链接:https://www.luogu.com.cn/problem/P3435
题意解读:定义字符串a是b的周期,当a是b的真前缀,且b是aa的前缀。给定字符串s,求s每一个前缀的最大周期长度之和。
解题思路:
针对字符串babababa进行样例模拟:
前缀子串 | 最大周期 | 周期长度 |
b | 空 | 0 |
ba | 空 | 0 |
bab | ba | 2 |
baba | ba | 2 |
babab | baba | 4 |
bababa | baba | 4 |
bababab | bababa | 6 |
babababa | bababa | 6 |
最大周期长度之和为24。
观察一下每行前缀除了最大周期,剩下的元素(绿色部分)有什么特点?
前缀子串 | 最大周期 |
b | 空 |
ba | 空 |
bab | ba |
baba | ba |
babab | baba |
bababa | baba |
bababab | bababa |
babababa | bababa |
要让剩下的元素是两个周期连接后"周期周期"的前缀,那么绿色部分必然是整个子串的前缀,并且要使得周期长度最大,绿色部分必须最短,也就是要求每个子串的最短相同前后缀。
前面已经在KMP算法中介绍过,Next[]数组的含义就是每个子串的最长相同前后缀,那么可以基于最长相同前后缀去计算最短相同前后缀,
比如要计算0~j的最短相同前后缀,可以不断判断Next[Next[j] - 1]找到为0前的最后一个非0值即可,如图所示:
最后,得到每个子串的最短相同前后缀长度之后,一个子串的最大周期=子串长度 - 最短相同前后缀长度(前提是周期不为空)
100分代码:
#include <bits/stdc++.h>
using namespace std;
int n;
string s;
int Next[1000005];
long long ans;
int main()
{
cin >> n >> s;
//计算每个子串的最长相同前后缀长度
for(int i = 1, j = 0; i < n; i++)
{
while(j && s[i] != s[j]) j = Next[j - 1];
if(s[i] == s[j]) j++;
Next[i] = j;
}
//计算每个子串的最短相同前后缀长度
for(int i = 0; i < n; i++)
{
int j = Next[i];
while(j && Next[j - 1]) j = Next[j - 1];
Next[i] = j;
}
//计算答案
for(int i = 0; i < n; i++)
{
if(Next[i] > 0) ans += i + 1 - Next[i]; //每个子串的proper前缀即子串长度减去最短前后缀长度
}
cout << ans;
return 0;
}