二叉树(下)
二叉查找树(Binary Search Tree)
二叉查找树是二叉树中最常用的一种类型,也叫二叉搜索树
。顾名思义,二叉查找树是为了实现快速查找而生的。还支持快速插入
、删除
一个数据。
-
特点
在树中的任意一个节点,其左子树中的每个节点的值,都要小于这个节点的值,而右子树节点的值都大于这个节点的值。
-
二叉查找树的查找操作
- 先取根节点,如果它等于我们要查找的数据,那就返回。
- 如果要查找的数据比根节点的值小,那就在左子树中递归查找;
- 如果要查找的数据比根节点的值大,那就在右子树中递归查找。
public class BinarySearchTree {
private Node tree;
public Node find(int data) {
Node p = tree;
while (p != null) {
if (data < p.data) p = p.left;
else if (data > p.data) p = p.right;
else return p;
}
return null;
}
public static class Node {
private int data;
private Node left;
private Node right;
public Node(int data) {
this.data = data;
}
}
}
- 二叉查找树的插入操作
新插入的数据一般都是在叶子节点上,所以我们只需要从根节点开始,依次比较要插入的数据和节点的大小关系。
- 插入的数据比节点的数据大,并且节点的右子树为空,就将新数据直接插到右子节点的位置;
- 如果不为空,就再递归遍历右子树,查找插入位置
- 同理,如果要插入的数据比节点数值小,并且节点的左子树为空,就将新数据插入到左子节点的位置;
- 如果不为空,就再递归遍历左子树,查找插入位置。
public void insert(int data) {
if (tree == null) {
tree = new Node(data);
return;
}
Node p = tree;
while (p != null) {
if (data > p.data) {
if (p.right == null) {
p.right = new Node(data);
return;
}
p = p.right;
} else { // data < p.data
if (p.left == null) {
p.left = new Node(data);
return;
}
p = p.left;
}
}
}
- 二叉查找树的删除操作
二叉查找树的查找、插入操作都比较简单易懂,但是它的删除操作就比较复杂了 。针对要删除节点的子节点个数的不同,我们需要分三种情况来处理。
-
要删除的节点是叶子节点。直接让其父节点指向该叶子节点的指针置为空即可;
-
要删除的节点存在一个子节点,不论子节点是作为左节点还是右节点。可以找到要删除的节点的父节点,然后将其指向被删除节点的指针指向被删除节点的子节点;
-
要删除的节点存在两个节点。当出现这种情况时,我们需要先找到有右子树中最小的节点(这个节点一定是个左节点),并将该节点的值赋值给要删除节点的值(相当于给这个最小节点挪了位置);然后再进行删除这个最小节点,
public void delete(int data) {
Node p = tree; // p指向要删除的节点,初始化指向根节点
Node pp = null; // pp记录的是p的父节点
while (p != null && p.data != data) {
pp = p;
if (data > p.data) p = p.right;
else p = p.left;
}
if (p == null) return; // 没有找到
// 要删除的节点有两个子节点
if (p.left != null && p.right != null) { // 查找右子树中最小节点
Node minP = p.right;
Node minPP = p; // minPP表示minP的父节点
while (minP.left != null) {
minPP = minP;
minP = minP.left;
}
p.data = minP.data; // 将minP的数据替换到p中
p = minP; // 下面就变成了删除minP了
pp = minPP;
}
// 删除节点是叶子节点或者仅有一个子节点
Node child; // p的子节点
if (p.left != null) child = p.left;
else if (p.right != null) child = p.right;
else child = null;
if (pp == null) tree = child; // 删除的是根节点
else if (pp.left == p) pp.left = child;
else pp.right = child;
}
- 二叉查找树的其他操作
除了插入、删除、查找操作之外,二叉查找树中还可以支持快速地查找最大节点和最小节点、前驱节点和后继节点
中序遍历二叉查找树,可以输出有序的数据序列,时间复杂度是 O(n),非常高效。因此,二叉查找树也叫作二叉排序树。
- 支持重复数据的二叉查找树
二叉查找树中不存在重复元素的情况。当树中存在重复元素时,我们可以采用两种策略:
(1)第一种策略:一个节点存储多个相同的元素,使用可扩容的数组存储
(2)第二种策略:相同的节点进行二次插入的时候,作为比其大的节点进行处理,这种这个相同的元素一定会出现再其右子树中。此时进行查找操作,当查找到相同元素后不应停止,而应该再去其右子树继续寻找,从而找到所有的元素;删除操作同理。
- 二叉查找树的复杂度分析
时间复杂度其实都跟树的高度成正比,也就是 O(height)。
二叉查找树的查找过程,是按层进行查找的。所以时间复杂度跟树的层数有关系。可以表示为O(layer)
最坏情况下,当元素按照升序或降序的顺序进行插入时,就会导致二叉查找树出现一边倒的情况,此时树的层数就等于树中元素的个数,时间复杂度为O(N)
最好情况下,二叉查找树是一棵完全二叉树,完全二叉树的层数k 可以表示为:n>= 1 + 2 + 4 +...+ 2^(k-2); n<= 1+ 2 + 4 +...+ 2^(k-2) + 2^(k -1) 。从而可以推导出 k <= logN 。所以时间复杂度为O(logN)
当对二叉查找树进行频繁的添加和删除时,可能会造成失衡,从而导致复杂度下降,最坏情况下降低至O(N)。
- 扩展:有了散列表的存在,为什么还需要二叉查找树?
(1)散列表无法有序输出元素,如果要想达到有序的输出元素,需要先进行排序。而二叉查找树直接中序遍历就可以得到
(2)散列表的实现过程需要考虑的因素比较多,比如散列函数的选择,散列冲突的解决办法等,而用二叉查找树就没有这些问题
(3)散列表虽然插入,删除,查找的时间复杂度是常量级别的,但是在出现散列冲突时,加上散列函数计算哈希值所耗费的时间而言,可能也没有logN快
(4)散列表虽然是常量时间复杂度,但是当出现散列冲突时,性能是不稳定的,而平衡二叉查找树确是非常稳定的
(5)散列表的填充因子不能太大,比较耗费内存,尤其是采用开发寻址法解决散列冲突时
总之每种数据结构都有其特点,具体情况具体分析,每一种数据结构都有适用其特点的场景,我们只需要在正确的场景下正确的使用合适的数据结构就好了。正所谓:存在即合理。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构