后缀排序

本文做复习用，不宜初学用。
注意排序顺序

定义

$s a$ 表示排名为 $i$ 的位置。

$r k$ 表示位置为 $i$ 的排名。

$y$ 表示按照第二关键字排序排名为 $i$ 的位置。

$h e i g h t$ 表示排名为 $i$ 和 $i - 1$ 的后缀的最大前缀

$h$ 表示位置为 $i$ 和它排名前一位的后缀的最大前缀

操作流程

最初字符串排序

这里是桶排序基础操作。

for(int i = 1; i <= n; ++i) ++c[rk[i] = a[i]];
for(int i = 1; i <= m; ++i) c[i] += c[i - 1];
for(int i = n; i >= 1; ++i) sa[c[rk[i]--] = i;//按照1,2,3的顺序排

为什么是倒叙的呢？你用手模拟一下ababa这个样例就懂了

进行倍增比较操作。

for(int i = 1; i <= n; i <<= 1)

第二关键字排序

这里是把最后那一部分没有第二关键字的放在最前面。

num = 0;
for(int i = n - k  + 1; i <= n; ++i) y[++num] = i;

对有第二关键字的排序。按照 $s a$ 数组，也就是排名进行。

for(int i = 1; i <= n; ++i) if(sa[i] - k > 0) y[++num] = sa[i] - k;

总体排序

清空桶。

for(int i = 1; i <= m; ++i) c[i] = 0;

这里先按照 $r k$ 排序，和最初字符串排序有点类似。

for(int i = 1; i <= n; ++i) ++c[rk[i]];
for(int i = 1; i <= m; ++i) c[i] += c[i - 1];
for(int i = n; i >= 1; --i) sa[c[rk[y[i]--] = y[i];//按照y[i]的顺序排

更新 $r k$ 数组和 $m$

这里把 $y$ 和 $r k$ 交换其实就是用 $y$ 暂时存储上一次的 $r k$ 。

比较当前 $s a [i]$ 和 $s a [i - 1]$ 是否完全相等。如果相等就和 $s a [i - 1]$ 赋一样的 $n u m$

swap(rk,y);num = 0;
for(int i = 1; i <= n; ++i)
    rk[sa[i]] = (y[sa[i]] == y[sa[i - 1]] && sa[i] + k <= n && sa[i - 1] + k <= n && y[sa[i] + k] == y[sa[i - 1] + k]) ? num : ++num;
if(num == n) break;
m = num; num;

LCP

定义

$s u f f (i)$ 表示以 i 开头的后缀。

$h e i g h t [i]$ 表示排名为 $i$ 与排名为 $i - 1$ 的后缀字符串的前缀。

$h [i]$ 表示位置为 $i$ 与它的排名 $- 1$ 的后缀字符串的前缀。

形式化的：

h e i g h t [i] = l c p (s u f f (s a [i]), s u f f (s a [i - 1])) h [i] = h e i g h t [r k [i]], h e i g h t [i] = h [s a [i]]

有这样的好性质：

h [i] \geq h [i - 1] - 1 l c p (s u f f (i), s u f f (j)) = {min}_{x = r k [i] + 1}^{r k [j]} l c p (s u f f (s a [x]), s u f f (s a [x - 1])) = {min}_{x = r k [i] + 1}^{r k [j]} h e i g h t [x]

所以要算 $l c p$ 直接用一个 $R M Q$ 就可以了。

求 h 数组

这里很好理解。

for(int i = 1; i <= n; ++i){
		h[i] = h[i - 1] - 1;
		if(h[i] < 0) h[i] = 0;
		while(a[sa[rk[i]] + h[i]] == a[sa[rk[i] - 1] + h[i]] ) ++h[i];
	}

posted @ 2023-07-27 09:37 He_Zi 阅读(19) 评论(1) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 9.4 CF1852 题解

· LGV引理

· 后缀数组学习笔记

· 【学习笔记】后缀排序

· 字符串后缀科技

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？
· 展开说说关于C#中ORM框架的用法！

公告

昵称： He_Zi
园龄： 2年2个月
粉丝： 6
关注： 8

+加关注

2025年3月

日

一

二

三

四

五

六

hfjh

后缀排序

后缀排序

定义

操作流程

最初字符串排序

第二关键字排序

总体排序

更新 $r k$ 数组和 $m$

LCP

定义

求 h 数组

公告

搜索

常用链接

我的标签

合集

随笔档案

相册

阅读排行榜

评论排行榜

推荐排行榜

最新评论

hfjh

后缀排序

后缀排序

定义

操作流程

最初字符串排序

第二关键字排序

总体排序

更新 rk 数组和 m

LCP

定义

求 h 数组

公告

搜索

常用链接

我的标签

合集

随笔档案

相册

阅读排行榜

评论排行榜

推荐排行榜

最新评论

更新 $r k$ 数组和 $m$