后缀数组

基数排序
算法思想：利用桶的单调性，从低到高位依次将整数放进对应数位的桶中。
时间复杂度： $O (d * (n + s i z))$ ，其中 $d$ 为数位， $n$ 为元素个数， $s i z$ 为桶的大小。
后缀树
对于字符串 $s$ ，取出 $s$ 所有的后缀字串，并建立字典树。这个树就是 $s$ 的后缀树。空间复杂度 $O (N^{2})$ 。
后缀数组 SA
对于字符串 $s$ ，定义 sa[i] 表示 $s$ 的 $n$ 个后缀按字典序排序后的第 $i$ 个后缀在 $s$ 中的下标，其中 $i$ 从 $0$ 开始。
后缀数组的实现
直接使用 sort 排序，由于字符串的比较是 $O (n)$ 的，总时间复杂度 $O (n^{2} \times \log n)$ 。

倍增求 sa[]。

将 $s$ 中的字母按照字典序从 $1$ 开始分配整数。
倍增拼接连续 $1, 2, 4, . . ., \log n$ 的整数来代表每个后缀的排名，当拼接的数字互不相同时即停止，由得到的数字 sort 即可确定字典序。
最坏复杂度 $O (n \log^{2} n)$
拼数的时候可以每次重新编号，长度控制在两位数。
利用基数排序的优化
拿基数排序替换快排。d=2，所以跑的很快。

rnk[i] 表示以下标 $i$ 开头的后缀在排序后的排名。

易知 sa[rnk[i]]=i;rnk[sa[i]]=i;。

height[i] 表示 lcp(sa[i-1],sa[i])。

应用：

在串里找最长重复子串：max(height)
找s和t的最长公共子串：在s+"#"+t里做最长重复子串，且sa[i-1]和sa[i]在两边。
本质不同子串数量： $n \times (n + 1) / 2 - \sum h e i g h t$

posted @ 2023-10-01 21:02 Forever1507 阅读(12) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· The 2021 Shanghai Collegiate

· 树链剖分学习笔记

· 后缀数组学习笔记

· 后缀数组学习笔记（未完成

· SA后缀数组学习笔记

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列01：轻松3步本地部署deepseek，普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现

公告

昵称： Forever1507
园龄： 2年2个月
粉丝： 3
关注： 5

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

最新随笔

随笔分类

随笔档案

阅读排行榜

推荐排行榜