查找算法(III)二叉排序树(B树)和平衡树(AVL树)
二叉排序树,也称B树,是查找算法中比较常提到的一种数据结构,本文介绍其基本概念和查找过程,并分析其查找效率,进而引出了平衡树(AVL树)的概念。
B树的结构
B树即为二叉搜索树或称二叉排序树(Binary Sort Tree),也有叫二叉查找树的。
它或者是一棵空树,或者是具有下列性质的二叉树:
1.若它的左子树不为空,则左子树上所有结点的值均小于它的根结点的值;
2.若它的右子树不为空,则右子树上所有结点的值均大于它的根结点的值;
3.它的左右子树也分别为二叉排序树。
中序遍历二叉排序树可以得到一个有序序列。
在二叉排序树上查找
首先将给定值和根结点的关键字比较,若相等,则查找成功,若不相等,则根据给定值和根结点关键字之间的大小关系,在左子树或右子树上继续进行查找。
若查到为空树时,说明该树中没有待查记录,故查找不成功。
二叉排序树的查找分析
在二叉排序树上查找其关键字等于给定值的结点的过程,恰是走了一条从根结点到该结点的路径的过程,和给定值比较的关键字个数等于路径长度加1(或结点所在层次数), 因此,和折半查找类似,与给定值比较的关键字个数不超过树的深度。
然而,折半查找长度为n的表的判定树是唯一的,而含有n个结点的二叉排序树却不唯一。
含有n个结点的二叉排序树的平均查找长度和树的形态有关,当先后插入的关键字有序时,构成的二叉排序树蜕变为单支树。
这时树的深度为n,其平均查找长度为(n+1)/2,和顺序查找相同,这是最差的情况。
显然,最好的情况应该是二叉排序树的形态和折半查找的判定树相同,其平均查找长度和log2n成正比,即我们希望二叉排序树是平衡的。
平衡二叉树
平衡二叉树(Balanced Binary Tree或 Height-Balanced Tree)又称AVL树。
它或者是一棵空树,或者是具有下列性质的二叉树:
它的左子树和右子树都是平衡二叉树,且左子树和右子树的深度之差的绝对值不超过1。
若将二叉树上结点的平衡因子BF(Balance Factor)定义为该结点的左子树深度减去它的右子树的深度,则平衡二叉树上所有结点的平衡因子只可能是-1,0和1.
在平衡树上进行查找的时间复杂度为O(logn)。