平衡树与finger search

1.复杂度分析

Treap

定理1： $n$ 个节点的Treap的期望深度为 $o(\log n)$

证明1：假设所有元素从小到大依次为 $a_{1},a_{2},...,a_{n}$ （不妨假设所有元素各不相同，若有相同可以将这些元素存在同一个位置上），则对于 $x$ 和 $y$ ，分类讨论：

1.若 $x\le y$ ，则 $x$ 是 $y$ 的祖先等价于 $a_{x}<\min_{x<j\le y}a_{j}$

2.若 $x>y$ ，则 $x$ 是 $y$ 的祖先等价于 $a_{x}<\min_{y\le j<x}a_{j}$

（这里要求随机权值构成小根堆，且不妨假设随机权值各不相同）

这件事的概率也就是 $x$ 权值最小的概率，即 $\frac{1}{|x-y|+1}$

$x$ 的深度也可以定义为 $x$ 的祖先数，而其期望祖先数即为 $\sum_{i=1}^{n}\frac{1}{|x-i|+1}\sim o(\log n)$

这是论文中给出的证明，但其实并不太严谨，这里再给出一种证明方式——

证明2：令 $T(n)$ 为 $n$ 个节点的Treap的期望深度，考虑枚举其中随机权值最小的点（作为根），即
$T(n)=n+\frac{\sum_{i=1}^{n}T(i-1)+T(n-i)}{n}=n+\frac{2}{n}\sum_{i=0}^{n-1}T(i)$
类似地，将 $n-1$ 的式子写出后两式相减，即
$T(n)-T(n-1)=1+\frac{2}{n}\sum_{i=0}^{n-1}T(i)-\frac{2}{n-1}\sum_{i=0}^{n-2}T(i)\le 1+\frac{2}{n}T(n-1)$
简单化简后，即
$\frac{T(n)}{n+1}\le \frac{1}{n+1}+\frac{T(n-1)}{n}\le \frac{1}{n+1}+\frac{1}{n}+\frac{T(n-2)}{n-1}\le ...\le \sum_{i=2}^{n+1}\frac{1}{i}\sim o(\log n)$
于是，即 $T(n)\sim o(n\log n)$ ，即所求证

Splay

定理2：对一个 $V$ 个节点的伸展树执行 $n$ 次Splay操作的复杂度为 $o((V+n)\log V)$

证明：对于一棵伸展树 $T$ ，定义节点 $x$ 的势能函数为 $r(x)=\log sz_{x}$ （其中 $sz_{x}$ 为其子树大小），则 $T$ 的势能函数为 $\varphi(T)=\sum_{x}r(x)$ （其中 $x$ 为 $T$ 中的节点）

假设第 $i$ 次操作后的Splay为 $T_{i}$ （特别的， $T_{0}$ 为初始的伸展树），第 $i$ 次操作复杂度（旋转次数）为 $a_{i}$ ，则第 $i$ 次操作的均摊复杂度记为 $b_{i}=a_{i}+R(T_{i})-R(T_{i-1})$ ，后者记为 $\Delta_{\varphi}(i)$

综上，总复杂度即
$\sum_{i=1}^{n}a_{i}=\sum_{i=1}^{n}b_{i}+R(T_{0})-R(T_{n})\le \sum_{i=1}^{n}b_{i}+V\log V$
下面，我们只需要考虑 $b_{i}$ 即可，对Splay中的三类情况分开讨论：

（为了方便，假设执行 $Splay(k)$ ，且 $fa$ 为 $k$ 的父亲， $ga$ 为 $k$ 的祖父，带 $'$ 为旋转后的 $T_{i}$ ）

1.单旋，其使得 $b_{i}$ 增加 $1+r'(fa)-r(k)\sim o(\log V)$

2.三点一线时，先旋转 $fa$ ，再旋转 $k$ ，其使得 $b_{i}$ 增加
$1+r'(fa)+r'(ga)-r(k)-r(fa)\le 1+r'(k)+r'(ga)-2r(k)$
根据 $sz'_{k}=sz_{k}+sz'_{ga}+1$ ，有 $2r'(k)-r(k)-r'(ga)\ge \log \frac{(sz_{k}+{sz'_{ga}})^{2}}{sz_{k}sz'_{ga}}\ge 2$

将 $2r'(k)-r(k)-r'(ga)-2\ge 0$ 加入上式，即有
$1+r'(k)+r'(ga)-2r(k)+2r'(k)-r(k)-r'(ga)-2\le 3(r'(k)-r(k))$
3.三点不一线时，旋转两次 $k$ ，类似地也可以证明其使得 $b_{i}$ 增加不超过 $3(r'(k)-r(k))$

注意到 $r'(k)$ 可以与下一次的 $r(k)$ 相消，因此第2类和第3类总增加量不超过 $3(r'(k)-r(k))\sim o(\log V)$

综上，即对于初始为0的 $b_{i}$ ，增加总量也不超过 $o(\log V)$ ，即 $b_{i}\sim o(\log V)$

将之代入，不难得到复杂度为 $o((V+n)\log V)$ ，即所求证

2.Treap的可持久化和树套树

可持久化

所有非均摊的数据结构基本都是可以可持久化的

论文中提到了关于Treap中可持久化不能直接复制随机值，而是在比较时进行随机判定是否旋转，并且旋转 $k$ 的概率为 $\frac{sz_{k}}{sz_{fa}}$ （ $fa$ 为 $k$ 的父亲）

（我觉得或许直接复制随机值应该也是对的吧）

树套树

事实上，旋转的Treap也是可以实现树套树的

定理3：若一次旋转 $k$ 的复杂度为 $o(sz_{k})$ ，则Treap单次插入操作期望复杂度为 $o(\log n)$

证明：假设插入 $k$ ，当 $k$ 旋转后 $k$ 必然是其子树中权值最小的点，这样的概率是 $\frac{1}{sz_{k}}$ ，那么这次旋转的期望复杂度即为 $o(1)$ ，也可以看作这个节点对答案的期望贡献为 $o(1)$

又因为前面说明树高为期望 $o(\log n)$ ，而只有 $k$ 到根路径上的点对答案会有期望 $o(1)$ 的贡献，总复杂度即期望 $o(\log n)$ ，结论成立

定理4：若一次重构 $k$ 子树时间复杂度 $o(sz_{k}\log sz_{k})$ ，则Treap单次删除期望复杂度为 $o(\log n)$

证明：由于Treap是随机的，删除节点的子树大小可以看作一个节点的期望子树大小

由于树高 $o(\log n)$ ，因此所有节点子树大小之和为 $o(n\log n)$ ，显然期望子树大小为 $o(\log n)$ ，将其子树暴力重构即可，对于 $o(\log\log n)$ 的复杂度可以忽略，即复杂度为期望 $o(\log n)$

上面所给的旋转以及重构的复杂度，也就是平衡树套序列的复杂度（每一个节点维护子树内所有元素所构成的序列），也就可以做到 $o(n\log n)$

而对于平衡树套权值线段树，此时插入和删除相较于上面两者也就多了一个 $\log n$ ，复杂度即 $o(n\log^{2}n)$ ，与替罪羊树相同，也是可以接受的

（树套树中的线段树不能互相嵌套，因此重构不能使用线段树合并，仍是 $o(sz_{k}\log sz_{k}\log n)$ 的）

3.Finger Search

Finger Search

关于Finger Search，即在一个数据结构中，令 $d(x,y)$ 为在 $x$ 和 $y$ 之间的元素个数（包括 $x$ 和 $y$ ），当已经确定 $x$ 的位置后，可以在 $o(\log d(x,y))$ 的时间内快速查询 $y$ 的操作

（另外下面还将考虑Finger Search的简单拓展，即快速插入和删除）

显然并不是所有数据结构都能支持Finger Search，下面分别来考虑Treap和Splay

Treap

定理5：在Treap上， $x$ 到 $y$ 的路径长度为期望 $o(\log d(x,y))$

证明：注意到 $x$ 到 $y$ 的路径长度即是 $x$ 祖先且不是 $y$ 祖先的节点数+是 $y$ 祖先且不是 $x$ 祖先的节点数，根据对称性可以仅考虑前者

假设Treap所有元素从小到大依次为 $a_{1},a_{2},...,a_{n}$ ，其中 $a_{i}=x$ 且 $a_{j}=y$ ，显然 $d(x,y)=j-i+1$

考虑一个节点 $a_{k}$ ，求出其满足“是 $x$ 祖先且不是 $y$ 祖先”的概率，将其累加即可

根据前面定理1的证明，我们需要对 $k$ 分类讨论：

1. $1\le k\le i$ ，这等价于 $k$ 是 $[k,i]$ 的最小值且 $[k,i]$ 的最小值大于 $(i,j]$ 的最小值，前者概率为 $\frac{1}{i-k+1}$ ，后者概率为 $\frac{j-i}{j-k+1}$ ，相乘后即 $\frac{j-i}{(i-k+1)(j-k+1)}$

注意到这就是 $\frac{1}{i-k+1}-\frac{1}{j-k+1}$ ，累加后即
$\sum_{k=1}^{i}\frac{1}{k}-\sum_{k=j-i+1}^{j}\frac{1}{k}=\sum_{k=1}^{i}\frac{1}{k}-(\sum_{k=1}^{j}\frac{1}{k}-\sum_{k=1}^{j-i}\frac{1}{k})\le \sum_{k=1}^{j-i}\frac{1}{k}\sim o(\log d(i,j))$
2. $i<k<j$ ，类似地概率为 $\frac{j-k}{(k-i+1)(j-i+1)}=\frac{1}{k-i+1}-\frac{1}{j-i+1}$ ，累加后即 $\sum_{k=1}^{j-i+1}\frac{1}{k}-1\sim o(\log d(i,j))$

由此，在Treap上再维护一个子树最小值和最大值，暴力从 $x$ 向父亲爬去找 $y$ 即可实现Finger Search

下面来考虑Finger Search的拓展，对于插入：根据定理3，可以发现Treap插入的瓶颈事实上就在于寻找位置，更具体的，我们有以下定理——

定理6：Treap单次插入操作期望旋转次数为 $o(1)$

证明：根据定理3的证明，一个点期望旋转次数，即其到根所有节点子树大小倒数之和

而所有点期望旋转次数之和，考虑一个点的贡献，不难发现恰好为1，即总和期望为 $o(n)$ ，那么其中一点期望次数为 $o(1)$ ，即所求证

那么找到位置后，再以 $o(1)$ 次旋转即可，即实现了Finger Search的插入

对于删除：Treap的删除需要将该节点旋转到子树叶子，根据定理4这一部分也就是 $o(\log\log n)$ ，也可以忽略，那么同样也可以支持删除

综上，Treap需要通过一些技巧来支持Finger Search即其拓展

Splay

在Splay中，由于每一次会将上次所插入、删除或查询的Splay到根，实际上也就是实现了Finger Search，更具体的来说，可以有以下结论——

定理7（Dynamic Finger Theorem）：对于一个 $n$ 个点的Splay，进行 $m$ 次操作，每一次操作的元素为 $a_{i}$ （特别的， $a_{0}$ 定义为初始Splay中的根），则复杂度为 $o(n+m+\sum_{i=1}^{m}\log d(a_{i-1},a_{i}))$

这个定理的证明比较复杂，这里就省略了

根据这个结论，也就说明Splay可以不需要附加其他操作来支持Finger Search即其拓展

4.Treap的快速合并和分裂

合并

考虑合并两颗Treap，分别为 $T_{1}$ 和 $T_{2}$ （假设大小分别为 $n$ 和 $m$ ，且 $T_{1}$ 中的权值严格小于 $T_{2}$ ），普通的合并也就是FHQ Treap，合并复杂度为 $o(\log n+\log m)$

事实上，Treap的合并还可以进一步优化，达到 $o(\log \min(n,m))$ 的复杂度

具体来说（不妨假设 $n>m$ ），在合并的递归过程中，一开始会又连续较多次都是以 $T_{1}$ 的根为根并将右儿子与 $T_{2}$ 合并，这些过程完全可以将最后一次与 $T_{2}$ 合并

更具体的，考虑从 $T_{1}$ 中的最大值开始（也就是从根不断向右儿子移动），不断向父亲移动，直至父亲的随机权值小于 $T_{2}$ 根节点的随机权值时停止，并将当前节点与 $T_{2}$ 合并并作为父亲的右儿子

（这里的合并就是普通的合并，即做到 $o(\log n+\log m)$ 的复杂度）

$m$ 显然是不变的，现在来考虑 $\log n$ ，也可以看作最大值移动的次数

最终这个位置将会被 $T_{2}$ 的根替代，而这条链并不会被压缩，也就是说最终合并后 $T_{2}$ 的根到 $T_{1}$ 中最大值的路径长度严格大于移动的次数，根据定理5可以得到是期望 $o(\log m)$ 的

$n<m$ 类似，也就是会有较多次将 $T_{1}$ 与 $T_{2}$ 的左儿子合并，同样可以证明复杂度为期望 $o(\log n)$

（当然，具体实现中可以更方便的直接自底向上进行合并，这里只是为了说明其实际意义）

分裂

对于一个大小为 $n+m$ 的Treap（记作 $T$ ），普通的分裂也是FHQ Treap，分裂复杂度为 $o(\log (n+m))$

Treap的分裂也可以优化，假设拆出两颗大小为 $n$ 和 $m$ 的子树（分别为 $T_{1}$ 和 $T_{2}$ ，且 $T_{1}$ 中的权值严格小于 $T_{2}$ ），则分裂也可以优化到 $o(\log \min(n,m))$ 的复杂度

类似合并，在分裂的过程中，会有很长时间都在向同一边拆分

更具体的，分裂有两种，先来考虑给出排名（也就是 $n$ 和 $m$ ）的方式：

不妨假设 $n>m$ ，从最大值出发去找到值所在的位置，根据定理5可以在 $o(\log m)$ 的时间内找到对应权值以及位置，同时还可以求出最大值与该权值的lca

在这个lca之前，显然都会被分到 $T_{1}$ ，因此可以直接在这个lca内部进行划分

此时递归的深度即与最后 $T_{2}$ 的深度相同，为期望 $o(\log m)$

$n<m$ 也是类似的，从最小值去找该值即可

但如果分裂给出的是权值，由于无法确定 $n$ 和 $m$ 的关系，仅是查找该节点就会退化为 $o(\log (n+m))$

这时候还有一个方法，从最小值和最大值同时去找这个权值，且双方每一次各移动一步，那么找到时所花的步数也就是期望 $o(\log \min(n,m))$ ，也就与其相同

启发式合并

启发式合并就不能保证权值有严格的关系，因此对于这样两颗大小为 $n$ 和 $m$ 的Treap（不妨假设 $n>m$ ），通常都是以 $o(m\log n)$ 的复杂度来完成合并的

总得来说，将 $n$ 个大小为1的Treap以此法启发式合并的复杂度为 $o(n\log^{2}n)$

但是，我们可以将较小的Treap中的权值从小到大插入，此时借助Finger Search的插入拓展，似乎可以优化复杂度，具体来说有以下定理——

定理8：以上述方式启发式合并 $n$ 个大小为1的Treap，复杂度为 $o(n\log n)$

证明：先来考虑以此法合并大小为 $n$ 和 $m$ （ $n>m$ ）的Treap的复杂度，也就可以看作求将 $n$ 划分为若干个数，每一个数的 $\log$ 之和

根据 $\log$ 函数的凸性，不难调整证明均匀划分时复杂度最低，即单次插入复杂度为 $o(\log \frac{n}{m})$

接下来，考虑每一个数的贡献：

假设其执行插入操作 $k$ 次，第 $i$ 次插入到的子树大小（指合并结束后）依次为 $a_{i}$ （特别的， $a_{0}=1$ ），由于 $a_{i-1}$ 恰好是上一次的 $m$ ，因此其贡献即 $\sum_{i=1}^{k}\log\frac{a_{i}}{a_{i-1}}=\log a_{k}\sim o(\log n)$

所有节点贡献之和即为 $o(n\log n)$ ，也就是复杂度

关于Splay

在上述操作中，Splay也可以支持部分操作：

1.快速合并，将较小的Splay的最小或最大值Splay到根，虽然这样合并看上去会增加 $\log \max(n,m)$ 的势能，但如果我们修改势能的定义，将其定义为所有非根节点势能和，还是可以做到均摊 $o(\log \min(n,m))$ 的复杂度

2.启发式合并，根据定理7可以证明其与Treap以此法启发式合并的复杂度相同，即也可以做到 $o(n\log n)$

3.对于分裂操作，需要将该节点Splay到根是 $o(\log (n+m))$ 的，似乎无法支持

posted @ 2021-03-25 13:05 PYWBKTDA 阅读(574) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列01：轻松3步本地部署deepseek，普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现

公告

昵称： PYWBKTDA
园龄： 5年7个月
粉丝： 80
关注： 11

+加关注

2025年3月

日

一

二

三

四

五

六

平衡树与finger search

1.复杂度分析

Treap

Splay

2.Treap的可持久化和树套树

可持久化

树套树

3.Finger Search

Finger Search

Treap

Splay

4.Treap的快速合并和分裂

合并

分裂

启发式合并

关于Splay

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论