BST（二叉搜索树）

BST

基础芝士

给定一棵二叉树，每个节点有权值，定义“BST 性质”为：
对于树中的任意一个节点 $x$ 都有：

$x$ 的权值大于 $x$ 的左子树中任意节点的权值。
$x$ 的权值小于 $x$ 的右子树中任意节点的权值。

即 $左子树任意点的权值 < x < 右子树任意点的权值$ 。

满足上述性质的二叉树即为“二叉搜索树”(BST)。可以发现，二叉搜索树的中序遍历的点权值单调递增。
一般情况下 BST 中无相同权值，当然有相同权值的也可以处理为无相同权值的。如图：

中序遍历结果为 $1, 2, 3, 4, 5, 6, 7, 8, 9$ 。

维护操作

建立

为避免越界，一般在 BST 中插入正负无穷。仅由这两个节点构成的 BST 即为空 BST。如图：

建立的操作即为建立一个空 BST：

const int inf=1<<30;
struct bst 
{
    int l,r,v;
}a[N];
int tot,root;

int New(int v)
{
    a[++tot].v=v;
    return tot;
}
void build()
{
    New(-inf),New(inf);
    root=1,a[1].r=2;
}

查找

查找 BST 中是否存在权值为 $v$ 的节点。从根节点开始，利用“BST 性质”，一层层往下查找。

设当前所在节点为 $x$ ，权值为 $y$ ：

$y = v$ ，则已找到。
$y > v$ ，若 $x$ 无左儿子，则说明不存在；若 $x$ 有左儿子，进入左子树继续查找。
$y < v$ ，若 $x$ 无右儿子，则说明不存在；若 $x$ 有右儿子，进入右子树继续查找。

用递归实现：

int find(int x,int v)
{
    int y=a[x].v;
    if(y==v) return x;
    if(x==0) return 0; //若x不存在
    return y>v ? find(a[x].l,v) : find(a[x].r,v);
}

用 while 实现：

int find(int v)
{
    int x=root;
    while(x)
    {
        int y=a[x].v;
        if(y==v) break;
        x= y>v ? a[x].l : a[x].r;
    }
    return x;
}

插入

在 BST 中插入一个权值为 $v$ 的点（假设原来不存在）。
类似于查找操作：
设当前所在节点为 $x$ ，权值为 $y$ ：

$y > v$ ，进入左子树继续查找。
$y < v$ ，进入右子树继续查找。
若接下来进入的点为空，则直接建立。
用递归实现：

int insert(int &x,int v)//使用&，更新其父节点的信息
{
    int y=a[x].v;
    if(y==v) return ;
    if(x==0)
    {
        x=New(v);
        return ;
    }
    return y>v ? insert(a[x].l,v) : insert(a[x].r,v);
}

求最大/最小值

求以节点 $x$ 为根节点的树的最大/最小值。在 BST 中，任一子树都是 BST，而 BST 的最小值一定在最左边的点上，最大值一定在最右边的点上（“BST 性质”）。如图：

则求最大值就是从 $x$ 开始一直向左子树走直到没有左子树，求最小值就是从 $x$ 开始一直向右子树走直到没有右子树，当然要注意避开正负无穷。

int get_min(int x)
{
    while(a[x].l) x=a[x].l;
    return x;
}
int get_max(int x)
{
    while(a[x].r) x=a[x].r;
    return x;
}

求前驱/后继

设节点为 $x$ ，权值为 $y$ 。

$x$ 的前驱：指中序遍历 BST 后，位于 $x$ 前的第一个点，即满足 $v < y$ 的最大的 $v$ 所对应的节点。
$x$ 的后继：指中序遍历 BST 后，位于 $x$ 后的第一个点，即满足 $v > y$ 的最小的 $v$ 所对应的节点。

因此，求 $x$ 的前驱即求 $x$ 左子树中的最大值，求 $x$ 的后继即求 $x$ 右子树中的最小值。

int get_pre(int x)
{
    return get_max(a[x].l);
}
int get_ne(int x)
{
    return get_min(a[x].r);
}

若给出的是 $y$ ：

int get_pre(int u,int v)
{
    if(u==0) return -inf;
    if(a[u].v>=v) return get_pre(a[u].l,v);//先找到左子树
    return max(a[u].v,get_pre(a[u].r,v));//再找到最大值
}
int get_ne(int u,int v)
{
    if(u==0) return inf;
    if(a[u].v<=v) return get_ne(a[u].r,v);//先找到右子树
    return min(a[u].v,get_ne(a[u].l,v));//再找最小值
}

删除

从 BST 中删除权值为 $v$ 的节点 $x$ 。
思考如何在删除 $x$ 后能维护 BST。

若 $x$ 的儿子个数小于2，则直接用 $x$ 的儿子代替 $x$ 的位置，与 $x$ 的父节点相连。
若 $x$ 的儿子个数等于2，考虑删除后，应该是 $x$ 的后继 $n e x t$ 代替它的位置，也就是要先删除 $n e x t$ ，再用 $n e x t$ 代替 $x$ 。而且 $n e x t$ 无左儿子，因为 $n e x t$ 是 $x$ 右子树的最小值。所以，用 $n e x t$ 的右儿子代替 $n e x t$ 的位置，再用 $n e x t$ 代替 $x$ 的位置。

void remove(int v)
{
    int &x=root;//同时修改x父节点的信息
    while(x)
    {
        int y=a[x].v;
        if(y==v) break;
        x= y>v ? a[x].l : a[x].r;
    }
    if(x==0) return;
    if(a[x].l==0) x=a[x].r;
    else if(a[x].r==0) x=a[x].l;
    else 
    {
        int next=get_ne(x);
        remove(a[next].v);
        a[next].l=a[x].l,a[next].r=a[x].r;
        x=next;
    }
}

结语

BST 中每一次操作的期望复杂度为 $O (\log n)$ ，但 BST 容易退化。当 BST 为一条链时，复杂度为 $O (n)$ 。为了解决该问题，出现了各种平衡二叉树，请看：Treap。

tips

点权值中需满足“BST性质”的称为“关键码”，平衡二叉树中会区分开。

posted @ 2024-01-11 15:31 zhouruoheng 阅读(166) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Treap（平衡树）

· 主席树（可持久化线段树）

· 二叉搜索树（BST）

· BST初探

· 深入理解二叉查找树(BST)的重要查找操作

阅读排行：
· winform 绘制太阳，地球，月球运作规律
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 写一个简单的SQL生成工具
· AI 智能体引爆开源社区「GitHub 热点速览」

zhouruoheng