二叉查找树(binary search tree)详解
二叉查找树(Binary Search Tree),也称二叉排序树(binary sorted tree),是指一棵空树或者具有下列性质的二叉树:
-
若任意节点的左子树不空,则左子树上所有结点的值均小于它的根结点的值
-
任意节点的右子树不空,则右子树上所有结点的值均大于它的根结点的值
-
任意节点的左、右子树也分别为二叉查找树
-
没有键值相等的节点(no duplicate nodes)
本文地址:http://www.cnblogs.com/archimedes/p/binary-search-tree.html,转载请注明源地址。
二叉查找树相比于其他数据结构的优势在于查找、插入的时间复杂度较低。为O(log n)。
二叉查找树是基础性数据结构,用于构建更为抽象的数据结构,如集合、multiset、关联数组等。
二叉查找树的查找过程和次优二叉树类似,通常采取二叉链表作为二叉查找树的存储结构。中序遍历二叉查找树可得到一个关键字的有序序列,一个无序序列可以通过构造一棵二叉
查找树变成一个有序序列,构造树的过程即为对无序序列进行查找的过程。每次插入的新的结点都是二叉查找树上新的叶子结点,在进行插入操作时,不必移动其它结点,只需改动
某个结点的指针,由空变为非空即可。搜索,插入,删除的复杂度等于树高,期望O(log n),最坏O(n)(数列有序,树退化成线性表).
虽然二叉查找树的最坏效率是O(n),但它支持动态查询,且有很多改进版的二叉查找树可以使树高为O(logn),如:SBT,AVL,红黑树等.故不失为一种好的动态查找方法.
基本操作实现:
1、二叉查找树声明
/*********二叉查找树声明 ********/ typedef struct tree_node *tree_prt; struct tree_node { element_type element; tree_ptr left; tree_prt right; }; typedef tree_ptr SEARCH_TREE;
2、查找操作
思路:若根结点的关键字等于查找的关键字,查找成功;否则,若小于根结点的关键字的值,递归查找左子树,否则若大于根结点的关键字的值,递归查找右子树,若子树为空,则查找不成功
/*********查找算法 ********/ tree_ptr find(element_type x, SEARCH_TREE T) { if(T ==NULL) return NULL; if(x < T->element) return (find(x, T->left)); else if(x > T->element) return (find(x, T->right)); else return T; }
3、查找最大最小结点
/*********查找最大最小结点 ********/ tree_ptr find_min(SEARCH_TREE T) //递归 { if(T == NULL) return NULL; else if(T->left == NULL) return T; else return find_min(T->left); } tree_ptr find_max(SEARCH_TREE T) //非递归 { if(T != NULL) { while(T->right != NULL) { T = T->right; } } return T; }
4、插入操作
思路:首先执行查找算法,找出被插入结点的父结点,判断被查结点是父结点的左孩子还是右孩子,将被插结点作为叶子结点插入,若二叉树为空,则首先单独生成根结点
/*********插入结点1 ********/ void insert(element_type x, SEARCH_TREE *T) { if(*T == NULL) { /* 空树 */ *T = (SEARCH_TREE)malloc(sizeof(struct tree_node)); if(*T == NULL) { printf("Out of space!!!"); return; } else { (*T)->element = x; (*T)->left = (*T)->right = NULL; } } else if(x < (*T)->element) { insert(x, &((*T)->left)); } else { insert(x, &((*T)->right)); } }
当然也可以使用返回插入结点的方式:
/*********插入结点2 ********/ tree_ptr insert(element_type x, SEARCH_TREE T) { if(T == NULL) { /* 空树 */ T = (SEARCH_TREE)malloc(sizeof(struct tree_node)); if(T == NULL) { printf("Out of space!!!"); return; } else { T->element = x; T->left = T->right = NULL; } } else if(x < T->element) { T->left = insert(x, T->left)); } else { T->right = insert(x, T->right)); } return T; }
5、删除操作
在二叉查找树删去一个结点,分三种情况讨论:
① 若p是叶子结点: 直接删除p,如图(b)所示。
② 若p只有一棵子树(左子树或右子树):直接用p的左子树(或右子树)取代p的位置而成为f的一棵子树。即原来p是f的左子树,则p的子树成为f的左子树;原来p是f的右子树,则p的子树成为f的右子树,如图(c)、 (d)所示。
③ 若p既有左子树又有右子树 :处理方法有以下两种,可以任选其中一种。
◆ 用p的直接前驱结点代替p。即从p的左子树中选择值最大的结点s放在p的位置(用结点s的内容替换结点p内容),然后删除结点s。s是p的左子树中的最右边的结点且没有右子树,对s的删除同②,如图(e)所示。
◆ 用p的直接后继结点代替p。即从p的右子树中选择值最小的结点s放在p的位置(用结点s的内容替换结点p内容),然后删除结点s。s是p的右子树中的最左边的结点且没有左子树,对s的删除同②。
void delete(SEARCH_TREE *p) { SEARCH_TREE q, s; if((*p)->right == NULL) { q = *p; *p = (*p)->left; free(q); } else if((*p)->left == NULL) { q = *p; *p = (*p)->right; free(q); } else { q = *p; s = (*p)->left; while(s->right != NULL) { q = s; s = s->right; } (*p)->element = s->element; if(q != p) { q->right = s->left; } else { q ->left = s->left; } } free(s); } void deleteBST(SEARCH_TREE *T, element_type key) { if(!(*T)) { return; } else if ((*T)->element == key) { free(*T); } else if((*T)->element > key) { deleteBST((*)T->left, key); } else { deleteBST((*)T->right, key); } }
编程实践
#include<stdio.h> #include<stdlib.h> #include<string.h> struct node { char name[31]; struct node *lchild, *rchild; int count; }tree; struct node *root; int n = 0; void mid_cal(struct node *root) { if(root != NULL) { mid_cal(root->lchild); printf("%s %.4lf\n", root->name, ((double)(root->count) / (double)n) * 100.0); mid_cal(root->rchild); } } void insertBST(struct node** root, char *s) { if(*root == NULL) { struct node *p = (struct node*)malloc(sizeof(tree)); strcpy(p->name, s); p->lchild = p->rchild = NULL; p->count = 1; *root = p; } else { if(strcmp(s, (*root)->name) == 0) { ((*root)->count)++; return; } else if(strcmp(s, (*root)->name) < 0) { insertBST(&((*root)->lchild), s); } else { insertBST(&((*root)->rchild), s); } } } int main() { char s[31]; while(gets(s)) { insertBST(&root, s); n++; } mid_cal(root); return 0; }
参考资料
1、Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein(潘金贵等译)《算法导论》. 机械工业出版社.
2、ACM/ICPC 算法训练教程
3、《数据结构》严蔚敏、吴伟民
4、维基百科