二叉查找树(binary search tree)详解

二叉查找树Binary Search Tree),也称二叉排序树(binary sorted tree),是指一棵空树或者具有下列性质的二叉树

  • 若任意节点的左子树不空,则左子树上所有结点的值均小于它的根结点的值

  • 任意节点的右子树不空,则右子树上所有结点的值均大于它的根结点的值

  • 任意节点的左、右子树也分别为二叉查找树

  • 没有键值相等的节点(no duplicate nodes)

本文地址:http://www.cnblogs.com/archimedes/p/binary-search-tree.html,转载请注明源地址。

二叉查找树相比于其他数据结构的优势在于查找、插入的时间复杂度较低。为O(log n)。

二叉查找树是基础性数据结构,用于构建更为抽象的数据结构,如集合、multiset、关联数组等。

二叉查找树的查找过程和次优二叉树类似,通常采取二叉链表作为二叉查找树的存储结构。中序遍历二叉查找树可得到一个关键字的有序序列,一个无序序列可以通过构造一棵二叉

查找树变成一个有序序列,构造树的过程即为对无序序列进行查找的过程。每次插入的新的结点都是二叉查找树上新的叶子结点,在进行插入操作时,不必移动其它结点,只需改动

某个结点的指针,由空变为非空即可。搜索,插入,删除的复杂度等于树高,期望O(log n),最坏O(n)(数列有序,树退化成线性表).

虽然二叉查找树的最坏效率是O(n),但它支持动态查询,且有很多改进版的二叉查找树可以使树高为O(logn),如:SBT,AVL,红黑树等.故不失为一种好的动态查找方法.

基本操作实现:

1、二叉查找树声明

/*********二叉查找树声明 ********/
typedef struct tree_node *tree_prt;
struct tree_node {
    element_type element;
    tree_ptr left;
    tree_prt right;
};
typedef tree_ptr SEARCH_TREE;

2、查找操作

思路:若根结点的关键字等于查找的关键字,查找成功;否则,若小于根结点的关键字的值,递归查找左子树,否则若大于根结点的关键字的值,递归查找右子树,若子树为空,则查找不成功

/*********查找算法 ********/
tree_ptr find(element_type x, SEARCH_TREE T) 
{
    if(T ==NULL)
        return NULL;
    if(x < T->element)
        return (find(x, T->left));
    else if(x > T->element)
        return (find(x, T->right));
    else
        return T;
}

3、查找最大最小结点

/*********查找最大最小结点 ********/
tree_ptr find_min(SEARCH_TREE T)  //递归
{
    if(T == NULL)
        return NULL;
    else if(T->left == NULL)
        return T;
    else 
        return find_min(T->left);
}
tree_ptr find_max(SEARCH_TREE T)  //非递归
{
    if(T != NULL) {
        while(T->right != NULL) {
            T = T->right;
        }
    }
    return T;
}

4、插入操作

思路:首先执行查找算法,找出被插入结点的父结点,判断被查结点是父结点的左孩子还是右孩子,将被插结点作为叶子结点插入,若二叉树为空,则首先单独生成根结点

/*********插入结点1 ********/
void insert(element_type x, SEARCH_TREE *T)
{
    if(*T == NULL) {  /* 空树 */
        *T = (SEARCH_TREE)malloc(sizeof(struct tree_node));
        if(*T == NULL) {
            printf("Out of space!!!");
            return;
        } else {
            (*T)->element = x;
            (*T)->left = (*T)->right = NULL;
        }
    } else if(x < (*T)->element) {
        insert(x, &((*T)->left));
    } else {
        insert(x, &((*T)->right));
    }
}

当然也可以使用返回插入结点的方式:

/*********插入结点2 ********/
tree_ptr insert(element_type x, SEARCH_TREE T)
{
    if(T == NULL) {  /* 空树 */
        T = (SEARCH_TREE)malloc(sizeof(struct tree_node));
        if(T == NULL) {
            printf("Out of space!!!");
            return;
        } else {
            T->element = x;
            T->left = T->right = NULL;
        }
    } else if(x < T->element) {
        T->left = insert(x, T->left));
    } else {
        T->right = insert(x, T->right));
    }
    return T;
}

5、删除操作

在二叉查找树删去一个结点,分三种情况讨论:

①  若p是叶子结点: 直接删除p,如图(b)所示。

②  若p只有一棵子树(左子树或右子树):直接用p的左子树(或右子树)取代p的位置而成为f的一棵子树。即原来p是f的左子树,则p的子树成为f的左子树;原来p是f的右子树,则p的子树成为f的右子树,如图(c)、 (d)所示。   

③ 若p既有左子树又有右子树 :处理方法有以下两种,可以任选其中一种。

◆  用p的直接前驱结点代替p。即从p的左子树中选择值最大的结点s放在p的位置(用结点s的内容替换结点p内容),然后删除结点s。s是p的左子树中的最右边的结点且没有右子树,对s的删除同②,如图(e)所示。

◆ 用p的直接后继结点代替p。即从p的右子树中选择值最小的结点s放在p的位置(用结点s的内容替换结点p内容),然后删除结点s。s是p的右子树中的最左边的结点且没有左子树,对s的删除同②。

void delete(SEARCH_TREE *p)
{
    SEARCH_TREE q, s;
    if((*p)->right == NULL) {
        q = *p;
        *p = (*p)->left;
        free(q);
    } else if((*p)->left == NULL) {
        q = *p;
        *p = (*p)->right;
        free(q);
    } else {
        q = *p;
        s = (*p)->left;
        while(s->right != NULL) {
            q = s;
            s = s->right;
        }
        (*p)->element = s->element;
        if(q != p) {
            q->right = s->left;
        } else {
            q ->left = s->left;
        }
    }
    free(s);
}
void deleteBST(SEARCH_TREE *T, element_type key)
{
    if(!(*T)) {
        return;
    } else if ((*T)->element == key) {
        free(*T);
    } else if((*T)->element > key) {
        deleteBST((*)T->left, key);
    } else {
        deleteBST((*)T->right, key);
    }
}

编程实践

poj2418 Hardwood Species

#include<stdio.h>
#include<stdlib.h>
#include<string.h>

struct node {
    char name[31];
    struct node *lchild, *rchild;
    int count;
}tree;
struct node *root;
int n = 0;
void mid_cal(struct node *root)
{
    if(root != NULL) {
        mid_cal(root->lchild);
        printf("%s %.4lf\n", root->name, ((double)(root->count) / (double)n) * 100.0);
        mid_cal(root->rchild);
    }
}

void insertBST(struct node** root, char *s)
{
    if(*root == NULL) {
        struct node *p = (struct node*)malloc(sizeof(tree));
        strcpy(p->name, s);
        p->lchild = p->rchild = NULL;
        p->count = 1;
        *root = p;
    } else {
        if(strcmp(s, (*root)->name) == 0) {
            ((*root)->count)++;
            return;
        } else if(strcmp(s, (*root)->name) < 0) {
            insertBST(&((*root)->lchild), s);
        } else {
            insertBST(&((*root)->rchild), s);
        }
    }
}

int main()
{
    char s[31];
    while(gets(s)) {
        insertBST(&root, s);
        n++;
    }
    mid_cal(root);
    return 0;
}

参考资料

1、Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein(潘金贵等译)《算法导论》. 机械工业出版社.

2、ACM/ICPC 算法训练教程

3、《数据结构》严蔚敏、吴伟民

4、维基百科

 

posted @ 2014-06-15 22:12  wuyudong  阅读(6747)  评论(2编辑  收藏  举报
Top_arrow