二叉搜索树
文章转载自:http://www.cnblogs.com/elaron/archive/2013/04/11/3015155.html
结构特点
二叉搜索树的特点是,小的值在左边,大的值在右边,即
比如:
这样的结构有一个好处是很容易获得最大值(Maximum)、最小值(minimum)、某元素的前驱(Precursor)、某元素的后继(Successor)。
最大值:树的最右节点。
最小值:树的最左节点。
某元素前驱:左子树的最右。
某元素的后继:右子树的最左。
基本操作
二叉搜索树的基本操作包括searching、traversal、insertion以及deletion。
(代码为了省地方没有按照规范来写,真正写代码的时候请一定遵照规范)
① searching
tree * search_tree(tree *l, item_type x){ if(l == null) return NULL; if(l->item == x) return l; if(x < l->item){ return (search_tree(l->left, x)); } if(x > l->item){ return (search_tree(l->right, x)); } }
时间复杂度为O(h),h为树的高度。
② traversal
由于小的节点在左边,大的节点在右边,因此使用中序(in-order)遍历可以方便的得到一个sorted list。
void traverse_tree(tree *l){ if(l != NULL){ traverse_tree(l->left); process_item(l->item); traverse_tree(l->right); } }
时间复杂度为O(n),n为树的总结点数。
③ insertion
insert_tree(tree **l, item_type x, tree *parent){ tree *p; /*temporary pointer*/ if(*l == NULL){ p = malloc(sizeof(tree)); p->item = x; p->left = p->right = NULL; p->parent = parent; *l = p; return; } if(x < (*l)->item){ insert_tree(&((*l)->left), x, *l); }else{ insert_tree(&((*l)->right), x, *l); } }
时间复杂度为O(h),h为树的高度。
④deletion
在删除节点时有三种情况:
1)要删除的节点为叶节点
那么直接删除即可。
2)要删除的节点有一个子节点
那么删除掉该节点,并用其唯一的子节点代替自己的位置即可。
3)要删除的节点有两个子节点
那么首先要找到该节点的右子树的最小值节点k,然后将该k替换掉待删除节点。
最坏情况下,时间复杂度为O(h)+指针的移动开销。
进阶
由上可知,二叉搜索树的dictionary operation(包括search、insertion、deletion)的时间复杂度均与O(h)相关,h为树的高度(log n),如果按照上述的insertion方法构建树,那么构建出来的树的形状各异,特别是当输入序列有序时,更会退化到链表的程度。所以,如果能用某种方法,将树的高度降低到最小,那么其dictionary operation的时间开销均可以降低,不过相对而言构建树的开销将增大。为了降低二叉搜索树的高度而提出了平衡二叉树(Balanced Binary Tree)的概念。它要求左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。这样就可以将搜索树的高度尽量减小。常用算法有红黑树、AVL、Treap、伸展树等。