Lyndon 分解小记

来个简单的。

概念#

Lyndon 串：一个字符串 $s$ 被称为 Lyndon 串，当且仅当 $s$ 整个串是所有后缀中严格最小的。

例如 $ababb, abcdefg$ 。

Lyndon 分解：将字符串 $s$ 分解为 $w_{1}, w_{2}, . . ., w_{k}$ ，满足 $w_{1} \geq w_{2} \geq . . . \geq w_{k}$ ，并且 $w_{1}, w_{2}, . . ., w_{k}$ 都是 Lyndon 串。

例如 $acaababc$ 可以分解为 $ac, aababc$ 。

性质#

① 对于 Lyndon 串 $u, v$ ，若 $u < v$ ，那么 $u v$ 也是 Lyndon 串。

证明

若 $u$ 不是 $v$ 的前缀，那么一定有 $u v < v$ 。
若 $u$ 是 $v$ 的前缀，由于 $v$ 是 Lyndon 串，那么 $v$ 中以位置 $| u | + 1$ 开头的后缀 $> v$ ，进而知 $u v < v$ 。

② 一个字符串 $s$ 的 Lyndon 分解存在且唯一。

存在性证明

令 $w_{1}, w_{2}, . . ., w_{| s |}$ 分别为 $s_{1}, s_{2}, . . ., s_{| s |}$ ，这些串都是 Lyndon 串。

对于 $i < | s |$ ，如果 $w_{i} < w_{i + 1}$ ，那么合并 $w_{i}, w_{i + 1}$ 。由性质①可知，合并后的串仍是 Lyndon 串。

一直合并，最后一定有 $w_{1} \geq w_{2} \geq . . . \geq w_{k}$ 。

唯一性证明

使用反证法，若 $s$ 有两种 Lyndon 分解：

$s = w_{1} w_{2} . . . w_{i - 1} w_{i} w_{i + 1} . . . w_{k}$
$s = w_{1} w_{2} . . . w_{i - 1} w_{i}^{'} w_{i + 1} . . . w_{j}^{'} . . . w_{k^{'}}$

钦定 $| w_{i} | \geq | w_{i}^{'} |$ ，并且 $w_{i} = w_{i}^{'} w_{i + 1}^{'} . . . w_{j - 1}^{'} pre (w_{j}^{'})$ 。

那么 $w_{i} \geq pre (w_{j}^{'})$ ，设 $pre (w_{j}^{'})$ 在 $w_{i}$ 中的开头位置为 $p$ ，则 $w_{i} \geq 「 w_{i} 中以位置 p 开头的后缀」$

这与 $w_{i}$ 是 Lyndon 串矛盾。

Duval 算法#

Duval 算法以 $O (n) - O (1)$ 的复杂度求出了一个字符串的 Lyndon 分解。

我们维护三个指针 $i, j, k$ ，把 $s$ 分成三段，分别为 $s_{1. . . i - 1}, s_{i . . . k - 1}, s_{k . . . n}$ 。

同时维护 $s_{i . . . k - 1}$ 的一个周期 $p = k - j$ ，即 $s_{i . . . k - 1} = s_{i . . . i + p - 1}^{t} + pre (s_{i . . . i + p - 1})$ ，并且 $s_{i . . . i + p - 1}$ 是 Lyndon 串。

使用增量法，目前考虑加入字符 $s_{k}$ ，分三种情况：

$s_{j} = s_{k}$

周期 $p$ 仍然合法，令 $j \leftarrow j + 1$ 。

$s_{j} < s_{k}$

可知 $s_{i . . . k}$ 是一个 Lyndon 串，重新设置周期长度，令 $j \leftarrow i$ 。

$s_{j} > s_{k}$

本轮分解完毕，得到 Lyndon 串 $s_{i . . . i + p - 1}, s_{i + p . . . i + 2 p - 1}, s_{i + 2 p, i + 3 p - 1}, . . .$ 。

每轮开始时，令 $j \leftarrow i, k \leftarrow i + 1$ 。

模板题

点击查看代码

#include <bits/stdc++.h>
#define ll long long
#define ull unsigned ll
#define fi first
#define se second
#define pir pair <ll, ll>
#define mkp make_pair
#define pb push_back
using namespace std;
const ll maxn = 5e6 + 10, inf = 1e17;
char s[maxn];
ll n, ans;
int main() {
	scanf("%s", s + 1); n = strlen(s + 1);
	for(ll i = 1; i <= n;) {
		ll j = i, k = i + 1;
		while(k <= n && s[j] <= s[k]) {
			if(s[j] == s[k]) ++j;
			else j = i;
			++k;
		}
		while(i <= j) {
			ans ^= i + k - j - 1;
			i += k - j;
		}
	}
	printf("%lld", ans);
	return 0;
}

这玩意可以直接求解最小表示法，这里懒得写了。

出处：https://www.cnblogs.com/Sktn0089/p/18185129

版权：本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

posted @ 2024-05-10 19:04 Lgx_Q 阅读(35) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Runs 学习笔记

· 近期总结 2023.10.28

· Lyndon 分解学习笔记

· Lyndon分解学习笔记

· Lyndon 串相关知识速记

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 使用C#创建一个MCP客户端
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列1：轻松3步本地部署deepseek，普通电脑可用
· 按钮权限的设计及实现

公告

昵称： Lgx_Q
园龄： 1年7个月
粉丝： 27
关注： 24

+加关注

2025年3月

日

一

二

三

四

五

六

Loading

Lgx_

Lyndon 分解小记

概念#

性质#

Duval 算法#

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论