[luoguP3809]后缀排序
题意
给定一个字符串,要求将它的所有后缀按照字典序排序,并按顺序输出每个后缀第一个字符的下标。
sol
这是后缀数组(Suffix Array, SA)的板子题。
我们定义:
表示 中下标在 到 之间的子串。
表示排名为 的后缀第一个字符的下标;
表示第一个字符下标为 的后缀的排名。
而本题就是计算 数组。
最朴素的做法即为将所有后缀进行一次排序,时间复杂度 ,这显然是远远不足的,我们需要对其优化。
下面介绍一种倍增的方法,可以 地计算出 数组。
首先根据所有长度为 的子串对 进行排序,即根据每个字符进行排序。当我们对所有长度为 的子串排序之后,我们将每个后缀的长度为 的前缀分为长度为 的两部分,根据之前得到的信息对这个后缀进行排序,直到所有数都排列完毕。
使用基数排序可以将复杂度优化到 。
代码
#include <iostream>
#include <algorithm>
#include <cstring>
using namespace std;
const int N = 1000005;
char s[N];
int n;
int sa[N], rk[N], oldrk[N], cnt[N], scd[N];
void get_sa(){
for (int i = 1; i <= n; i ++ ) cnt[rk[i] = s[i]] ++ ;
for (int i = 1; i <= 128; i ++ ) cnt[i] += cnt[i - 1];
for (int i = n; i; i -- ) sa[cnt[rk[i]] -- ] = i;
for (int w = 1, m = 128, p = 0; ; m = p, p = 0, w <<= 1){
for (int i = n - w + 1; i <= n; i ++ ) scd[ ++ p] = i;
for (int i = 1; i <= n; i ++ )
if (sa[i] > w) scd[ ++ p] = sa[i] - w;
memset(cnt, 0, m + 1 << 2);
memcpy(oldrk, rk, n + 1 << 2);
for (int i = 1; i <= n; i ++ ) cnt[rk[i]] ++ ;
for (int i = 1; i <= m; i ++ ) cnt[i] += cnt[i - 1];
for (int i = n; i; i -- ) sa[cnt[rk[scd[i]]] -- ] = scd[i];
p = 0;
for (int i = 1; i <= n; i ++ ) rk[sa[i]] = (oldrk[sa[i - 1]] == oldrk[sa[i]] && oldrk[sa[i - 1] + w] == oldrk[sa[i] + w]) ? p : ++ p;
if (p >= n) return ;
}
}
int main(){
scanf("%s", s + 1);
n = strlen(s + 1);
get_sa();
for (int i = 1; i <= n; i ++ ) printf("%d ", sa[i]);
return 0;
}
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!