二叉树（下）

二叉查找树（Binary Search Tree）

二叉查找树（Binary Search Tree）

二叉查找树是二叉树中最常用的一种类型，也叫二叉搜索树。顾名思义，二叉查找树是为了实现快速查找而生的。还支持快速插入、删除一个数据。

特点
在树中的任意一个节点，其左子树中的每个节点的值，都要小于这个节点的值，而右子树节点的值都大于这个节点的值。
二叉查找树的查找操作

先取根节点，如果它等于我们要查找的数据，那就返回。
如果要查找的数据比根节点的值小，那就在左子树中递归查找；
如果要查找的数据比根节点的值大，那就在右子树中递归查找。


public class BinarySearchTree {
  private Node tree;

  public Node find(int data) {
    Node p = tree;
    while (p != null) {
      if (data < p.data) p = p.left;
      else if (data > p.data) p = p.right;
      else return p;
    }
    return null;
  }

  public static class Node {
    private int data;
    private Node left;
    private Node right;

    public Node(int data) {
      this.data = data;
    }
  }
}

二叉查找树的插入操作

新插入的数据一般都是在叶子节点上，所以我们只需要从根节点开始，依次比较要插入的数据和节点的大小关系。

插入的数据比节点的数据大，并且节点的右子树为空，就将新数据直接插到右子节点的位置；
如果不为空，就再递归遍历右子树，查找插入位置
同理，如果要插入的数据比节点数值小，并且节点的左子树为空，就将新数据插入到左子节点的位置；
如果不为空，就再递归遍历左子树，查找插入位置。


public void insert(int data) {
  if (tree == null) {
    tree = new Node(data);
    return;
  }

  Node p = tree;
  while (p != null) {
    if (data > p.data) {
      if (p.right == null) {
        p.right = new Node(data);
        return;
      }
      p = p.right;
    } else { // data < p.data
      if (p.left == null) {
        p.left = new Node(data);
        return;
      }
      p = p.left;
    }
  }
}

二叉查找树的删除操作

二叉查找树的查找、插入操作都比较简单易懂，但是它的删除操作就比较复杂了。针对要删除节点的子节点个数的不同，我们需要分三种情况来处理。

要删除的节点是叶子节点。直接让其父节点指向该叶子节点的指针置为空即可;
要删除的节点存在一个子节点，不论子节点是作为左节点还是右节点。可以找到要删除的节点的父节点，然后将其指向被删除节点的指针指向被删除节点的子节点;
要删除的节点存在两个节点。当出现这种情况时，我们需要先找到有右子树中最小的节点（这个节点一定是个左节点），并将该节点的值赋值给要删除节点的值（相当于给这个最小节点挪了位置）；然后再进行删除这个最小节点，


public void delete(int data) {
  Node p = tree; // p指向要删除的节点，初始化指向根节点
  Node pp = null; // pp记录的是p的父节点
  while (p != null && p.data != data) {
    pp = p;
    if (data > p.data) p = p.right;
    else p = p.left;
  }
  if (p == null) return; // 没有找到

  // 要删除的节点有两个子节点
  if (p.left != null && p.right != null) { // 查找右子树中最小节点
    Node minP = p.right;
    Node minPP = p; // minPP表示minP的父节点
    while (minP.left != null) {
      minPP = minP;
      minP = minP.left;
    }
    p.data = minP.data; // 将minP的数据替换到p中
    p = minP; // 下面就变成了删除minP了
    pp = minPP;
  }

  // 删除节点是叶子节点或者仅有一个子节点
  Node child; // p的子节点
  if (p.left != null) child = p.left;
  else if (p.right != null) child = p.right;
  else child = null;

  if (pp == null) tree = child; // 删除的是根节点
  else if (pp.left == p) pp.left = child;
  else pp.right = child;
}

二叉查找树的其他操作

除了插入、删除、查找操作之外，二叉查找树中还可以支持快速地查找最大节点和最小节点、前驱节点和后继节点

中序遍历二叉查找树，可以输出有序的数据序列，时间复杂度是 O(n)，非常高效。因此，二叉查找树也叫作二叉排序树。

支持重复数据的二叉查找树

二叉查找树中不存在重复元素的情况。当树中存在重复元素时，我们可以采用两种策略：
（1）第一种策略：一个节点存储多个相同的元素，使用可扩容的数组存储
（2）第二种策略：相同的节点进行二次插入的时候，作为比其大的节点进行处理，这种这个相同的元素一定会出现再其右子树中。此时进行查找操作，当查找到相同元素后不应停止，而应该再去其右子树继续寻找，从而找到所有的元素；删除操作同理。

二叉查找树的复杂度分析

时间复杂度其实都跟树的高度成正比，也就是 O(height)。
二叉查找树的查找过程，是按层进行查找的。所以时间复杂度跟树的层数有关系。可以表示为O(layer)

最坏情况下，当元素按照升序或降序的顺序进行插入时，就会导致二叉查找树出现一边倒的情况，此时树的层数就等于树中元素的个数，时间复杂度为O(N)
最好情况下，二叉查找树是一棵完全二叉树，完全二叉树的层数k 可以表示为：n>= 1 + 2 + 4 +...+ 2^(k-2); n<= 1+ 2 + 4 +...+ 2^(k-2) + 2^(k -1) 。从而可以推导出 k <= logN 。所以时间复杂度为O(logN)

当对二叉查找树进行频繁的添加和删除时，可能会造成失衡，从而导致复杂度下降，最坏情况下降低至O(N)。

扩展：有了散列表的存在，为什么还需要二叉查找树？
（1）散列表无法有序输出元素，如果要想达到有序的输出元素，需要先进行排序。而二叉查找树直接中序遍历就可以得到
（2）散列表的实现过程需要考虑的因素比较多，比如散列函数的选择，散列冲突的解决办法等，而用二叉查找树就没有这些问题
（3）散列表虽然插入，删除，查找的时间复杂度是常量级别的，但是在出现散列冲突时，加上散列函数计算哈希值所耗费的时间而言，可能也没有logN快
（4）散列表虽然是常量时间复杂度，但是当出现散列冲突时，性能是不稳定的，而平衡二叉查找树确是非常稳定的
（5）散列表的填充因子不能太大，比较耗费内存，尤其是采用开发寻址法解决散列冲突时

总之每种数据结构都有其特点，具体情况具体分析，每一种数据结构都有适用其特点的场景，我们只需要在正确的场景下正确的使用合适的数据结构就好了。正所谓：存在即合理。

posted @ 2022-09-11 10:40 fionna 阅读(21) 评论(0) 编辑收藏举报

刷新页面返回顶部

二叉树（下）

二叉查找树（Binary Search Tree）

公告