二叉树(下)

二叉查找树(Binary Search Tree)

二叉查找树是二叉树中最常用的一种类型,也叫二叉搜索树。顾名思义,二叉查找树是为了实现快速查找而生的。还支持快速插入删除一个数据。

  1. 特点
    在树中的任意一个节点,其左子树中的每个节点的值,都要小于这个节点的值,而右子树节点的值都大于这个节点的值。
    image

  2. 二叉查找树的查找操作

  • 先取根节点,如果它等于我们要查找的数据,那就返回。
  • 如果要查找的数据比根节点的值小,那就在左子树中递归查找;
  • 如果要查找的数据比根节点的值大,那就在右子树中递归查找。

image


public class BinarySearchTree {
  private Node tree;

  public Node find(int data) {
    Node p = tree;
    while (p != null) {
      if (data < p.data) p = p.left;
      else if (data > p.data) p = p.right;
      else return p;
    }
    return null;
  }

  public static class Node {
    private int data;
    private Node left;
    private Node right;

    public Node(int data) {
      this.data = data;
    }
  }
}
  1. 二叉查找树的插入操作

新插入的数据一般都是在叶子节点上,所以我们只需要从根节点开始,依次比较要插入的数据和节点的大小关系。

  • 插入的数据比节点的数据大,并且节点的右子树为空,就将新数据直接插到右子节点的位置;
  • 如果不为空,就再递归遍历右子树,查找插入位置
  • 同理,如果要插入的数据比节点数值小,并且节点的左子树为空,就将新数据插入到左子节点的位置;
  • 如果不为空,就再递归遍历左子树,查找插入位置。

image


public void insert(int data) {
  if (tree == null) {
    tree = new Node(data);
    return;
  }

  Node p = tree;
  while (p != null) {
    if (data > p.data) {
      if (p.right == null) {
        p.right = new Node(data);
        return;
      }
      p = p.right;
    } else { // data < p.data
      if (p.left == null) {
        p.left = new Node(data);
        return;
      }
      p = p.left;
    }
  }
}
  1. 二叉查找树的删除操作

二叉查找树的查找、插入操作都比较简单易懂,但是它的删除操作就比较复杂了 。针对要删除节点的子节点个数的不同,我们需要分三种情况来处理。

  • 要删除的节点是叶子节点。直接让其父节点指向该叶子节点的指针置为空即可;

  • 要删除的节点存在一个子节点,不论子节点是作为左节点还是右节点。可以找到要删除的节点的父节点,然后将其指向被删除节点的指针指向被删除节点的子节点;

  • 要删除的节点存在两个节点。当出现这种情况时,我们需要先找到有右子树中最小的节点(这个节点一定是个左节点),并将该节点的值赋值给要删除节点的值(相当于给这个最小节点挪了位置);然后再进行删除这个最小节点,


public void delete(int data) {
  Node p = tree; // p指向要删除的节点,初始化指向根节点
  Node pp = null; // pp记录的是p的父节点
  while (p != null && p.data != data) {
    pp = p;
    if (data > p.data) p = p.right;
    else p = p.left;
  }
  if (p == null) return; // 没有找到

  // 要删除的节点有两个子节点
  if (p.left != null && p.right != null) { // 查找右子树中最小节点
    Node minP = p.right;
    Node minPP = p; // minPP表示minP的父节点
    while (minP.left != null) {
      minPP = minP;
      minP = minP.left;
    }
    p.data = minP.data; // 将minP的数据替换到p中
    p = minP; // 下面就变成了删除minP了
    pp = minPP;
  }

  // 删除节点是叶子节点或者仅有一个子节点
  Node child; // p的子节点
  if (p.left != null) child = p.left;
  else if (p.right != null) child = p.right;
  else child = null;

  if (pp == null) tree = child; // 删除的是根节点
  else if (pp.left == p) pp.left = child;
  else pp.right = child;
}
  1. 二叉查找树的其他操作

除了插入、删除、查找操作之外,二叉查找树中还可以支持快速地查找最大节点最小节点前驱节点后继节点

中序遍历二叉查找树,可以输出有序的数据序列时间复杂度是 O(n),非常高效。因此,二叉查找树也叫作二叉排序树

  1. 支持重复数据的二叉查找树

二叉查找树中不存在重复元素的情况。当树中存在重复元素时,我们可以采用两种策略:
(1)第一种策略:一个节点存储多个相同的元素,使用可扩容的数组存储
(2)第二种策略:相同的节点进行二次插入的时候,作为比其大的节点进行处理,这种这个相同的元素一定会出现再其右子树中。此时进行查找操作,当查找到相同元素后不应停止,而应该再去其右子树继续寻找,从而找到所有的元素;删除操作同理。

  1. 二叉查找树的复杂度分析

时间复杂度其实都跟树的高度成正比,也就是 O(height)
二叉查找树的查找过程,是按层进行查找的。所以时间复杂度跟树的层数有关系。可以表示为O(layer)

最坏情况下,当元素按照升序或降序的顺序进行插入时,就会导致二叉查找树出现一边倒的情况,此时树的层数就等于树中元素的个数,时间复杂度为O(N)
最好情况下,二叉查找树是一棵完全二叉树,完全二叉树的层数k 可以表示为:n>= 1 + 2 + 4 +...+ 2^(k-2); n<= 1+ 2 + 4 +...+ 2^(k-2) + 2^(k -1) 。从而可以推导出 k <= logN 。所以时间复杂度为O(logN)

当对二叉查找树进行频繁的添加和删除时,可能会造成失衡,从而导致复杂度下降,最坏情况下降低至O(N)。

  1. 扩展:有了散列表的存在,为什么还需要二叉查找树?
    (1)散列表无法有序输出元素,如果要想达到有序的输出元素,需要先进行排序。而二叉查找树直接中序遍历就可以得到
    (2)散列表的实现过程需要考虑的因素比较多,比如散列函数的选择,散列冲突的解决办法等,而用二叉查找树就没有这些问题
    (3)散列表虽然插入,删除,查找的时间复杂度是常量级别的,但是在出现散列冲突时,加上散列函数计算哈希值所耗费的时间而言,可能也没有logN快
    (4)散列表虽然是常量时间复杂度,但是当出现散列冲突时,性能是不稳定的,而平衡二叉查找树确是非常稳定的
    (5)散列表的填充因子不能太大,比较耗费内存,尤其是采用开发寻址法解决散列冲突时

总之每种数据结构都有其特点,具体情况具体分析,每一种数据结构都有适用其特点的场景,我们只需要在正确的场景下正确的使用合适的数据结构就好了。正所谓:存在即合理。

posted @ 2022-09-11 10:40  fionna  阅读(21)  评论(0编辑  收藏  举报