C语言实现二叉树-02版

---恢复内容开始---

昨天,提交完我们的二叉树项目后,今天早上项目经理早早给我打电话;

他说,小伙子干的不错。但是为什么你上面的insert是recusive的呢?

你难道不知道万一数据量大啦!那得消耗很多内存哈!;

我大吃一惊,那么项目经理果然不是吃素的,他是在提醒我别投机取巧啦;

我们都知道递归实现树是比较简单的一种方式;

的确它的性能比较差,试想每次递归都要把当前函数压栈,然后出栈。。

好啦,那咱们今天就用非递归实现它;反正今天我就不干别的啦;

Problem

下面的代码你应该比较熟习啦!如果忘记啦请看C语言实现二叉树-01版

#include <stdio.h>
#include <stdlib.h>

typedef struct _node {
    int data;
    struct _node *link[2];
}Node;

typedef struct _tree{
    struct _node *root;
}Tree;

Tree * init_tree()
{
    Tree *temp = (Tree*)malloc(sizeof(Tree));
    temp->root = NULL;
    return temp;
}

接下来我们重写insert的非递归实现:

int insert(Tree *tree, int data)
{
    if(tree->root == NULL){

        //TODO
    }else{
        //TODO
    }   
    return 1;
}

我首先把框架写出来啦,就好比让你看看你将要完成的一座别墅建设的图纸;

要是你已经有“建设方案”啦!甚至可以暂时不要继续往下看,而是自己试着造出来;

当然,如果您还是没有什么头绪,那就烦劳您继续往下看看哦:)

显然,如果if语句tree->root == NULL成立,说明我们的树还未发芽呢。

何不给他来一朵嫩芽呢;

int insert(Tree *tree, int data)
{
    if(tree->root == NULL){
        tree->root = make_node(data);
    }else{
        //TODO
    }   
    return 1;
}

好啦,现在不用考虑树的芽啦,现在要考虑的是else部分的树的生长问题啦;

为了在树的芽上继续生长,我们需要知道树根(注意其实这里得树芽指的是树根存在的确认)

我不知道怎么描述这些啦!如果我表达的不足以让你理解那就跳过这几行文字吧;

 

int insert(Tree *tree, int data)
{
    if(tree->root == NULL){
        tree->root = make_node(data);
    }else{
        Node * it = tree->root;
        for(;;){
            //TODO
        }
    }   
    return 1;
}

爬过树的朋友都知道,要想去摘果子,必须沿着树枝爬下去;

直到找到果子为止,因此,你需要一个遍历的过程;

而遍历通常是一个循环体;

现在你知道怎么构思下面的代码啦吗?

什么,还是不清楚哈?;

ok那么我们继续分析;

int insert(Tree *tree, int data)
{
    if(tree->root == NULL){
        tree->root = make_node(data);
    }else{
        Node * it = tree->root;
        int dir;
        for(;;){    
            dir = it->data < data;
            if(it->data == data){
                return 0;
            }else if(it->link[dir] == NULL){
                break;
            }
            it = it->link[dir];
        }
        //TODO
    }   
    return 1;
}

我们声明啦dir是direction(方向的意思);

它的值只有0,1这两种可能;

好啦看看一个小树;

第一个if语句我们就不用进入啦!因为节点6 == NULL返回假,所以if部分不执行;

那么进入else部分;

假设我们要插入的数据是8,那么it-data < data用真正的数据展开呢就是

6<8显然,成立;

那么返回1,所以dir第一次代表的是1;

内层的if语句我们显然不会执行;

我们也不会执行else if部分;

好吧!我们执行一次it=it->link[dir];

刚才我们已经知道,dir代表的是1;

显然it现在指向啦它的右子树;(希望你还记得link[1]代表右子树,link[0]代表左子树);

此时,it已经指向啦节点7;

此时,你应该看看那个树是否有节点7;

好啦!我们继续循环;

又到啦

dir = it->data < data;

这行代码相当于:

if(it->data < data){
    dir = 1;
}else{
    dir = 0;
}

相信对你来说这是非常简单容易理解的;

那此时it所指的数据是7;

还记得我们要插入的数据是8吗?

显然7<8的,所以我们的dir还是1;

我们不会执行if语句的,这个原因请您思考吧;

我们直接走到啦else if语句;

if(it->data == data){
        return 0;
 }else if(it->link[dir] == NULL){
        break;
 }

我们发现,it->[dir]的确指向的是NULL;

好啦!我们找到啦!果子啦,我们应该break啦;

take break可能更加是人类需要的;

int insert(Tree *tree, int data)
{
    if(tree->root == NULL){
        tree->root = make_node(data);
    }else{
        Node * it = tree->root;
        int dir ;
        for(;;){
            dir = it->data < data;
            if(it->data == data){
                return 0;
            }else if(it->link[dir] == NULL){
                break;
            }
            it = it->link[dir];
        }
        //TODO
    }
    return 1;
}

( ⊙ o ⊙ )!怎么还有一个TODO啊!你会惊讶到我们不是已经找到啦目标啦吗;

的确,你找到啦,可是咱们没有把果子摘下来啊;

一起用力把果子摘下来吧(其实是把节点安装上去)

int insert(Tree *tree, int data)
{
    if(tree->root == NULL){
        tree->root = make_node(data);
    }else{
        Node * it = tree->root;
        int dir ;
        for(;;){
            dir = it->data < data;
            if(it->data == data){
                return 0;
            }else if(it->link[dir] == NULL){
                break;
            }
            it = it->link[dir];
        }
        it->link[dir] = make_node(data);
    }
    return 1;
}

it->link[dir]到底是指向哪啊?你不经会问;

再看看这图吧:

最后,你的8刚好插入到7得右子树下;

这就是你所有的工作啦;

#include <stdio.h>
#include <stdlib.h>

typedef struct _node {
    int data;
    struct _node *link[2];
}Node;

typedef struct _tree{
    struct _node *root;
}Tree;

Tree * init_tree()
{
    Tree *temp = (Tree*)malloc(sizeof(Tree));
    temp->root = NULL;
    return temp;
}

Node * make_node(int data)
{
    Node *temp = (Node*)malloc(sizeof(Node));
    temp->link[0] = temp->link[1] = NULL;
    temp->data = data;
    return temp;
}

int insert(Tree *tree, int data)
{
    if(tree->root == NULL){
        tree->root = make_node(data);
    }else{
        Node * it = tree->root;
        int dir ;
        for(;;){
            dir = it->data < data;
            if(it->data == data){
                return 0;
            }else if(it->link[dir] == NULL){
                break;
            }   
            it = it->link[dir];
        }   
        it->link[dir] = make_node(data);
    }   
    return 1;
}

void print_inorder_recursive(Node *root)
{
    if(root){
        print_inorder_recursive(root->link[0]);
        printf("data:%d\n",root->data);
        print_inorder_recursive(root->link[1]);
    }
    return ;
}

void print_inorder(Tree *tree)
{
    print_inorder_recursive(tree->root);
    return ;
}

int main(void)
{
    Tree * tree = init_tree();
    insert(tree,6);
    insert(tree,7);
    insert(tree,5);
    insert(tree,8);

    print_inorder(tree);
    return 0;
}

运行结果如下;

好啦!非递归已经完成啦;

昨天的任务算是完成啦,今天的还没开始呢;

我们需要完成今天的新任务啦;

Problem

我们需要删除树上的某个节点,怎么办呢?

嘘,别先别想递归怎么实现啦,万一经理又不满意,明天还得改;

Solution

首先,我们需要理解几点;

第一,只有只是存在根的树才能被“砍”

int remove(Tree *tree, int data)
{
    if(tree->root != NULL)
    {
        //TODO
    }
    
    return 1;
}

所以代码大概是这样的结构;

而,要删除特定的节点,我们得先找到它;

因此,我们需要一个遍历的结构;

int remove(Tree *tree, int data)
{
    if(tree->root != NULL)
    {
        Node *p = NULL;
        Node *succ;
        Node *it = tree->root;
        int dir;
        for(;;){
            //TODO
        }

    }
    
    return 1;
}

我们这里声明啦两个看起来比较陌生的面孔p 和succ;

p其实是parent(父亲)的缩写,succ是successor(继承者)的缩写;

先来看一看下面的树:

假设我们需要删除的节点是6;

继承者可能是7,就是他的大儿子哈(右子树);

可是呢!如果这棵树是这样的呢?

我们发现,假设再让7继承就会出现奇怪的现象;

这肯定不能叫做二叉树啦;

就好比,古代的皇帝,绝对不会有几个太子的;

因此,只有一个可以继承皇位,但是继承皇位的不一定是太上皇的儿子;

可能是其孙子;(好像古代就有这种情况出现,我历史学得差,不觉得啦)

所以正确的继承方式是:

好啦!原理大概是这么啦,看看代码这么实现的吧:

int remove(Tree *tree, int data)
{
    if(tree->root != NULL)
    {
        Node *p = NULL;
        Node *succ;
        Node *it = tree->root;
        int dir;
        for(;;){
            if( it == NULL){
                return 0;
            }else if(it->data == data){
                break;
            }
            dir = it->data < data;
            p = it;
            it = it->link[dir];
        }

    }

    return 1;
}

你会发现,代码与插入的实现非常相似,只是多了一个 p = it;

这样坐的目的是,当it要深入到下一个分叉时,给自己留一个后路;

所以保存了自己的前一个备份;

看看这棵树,我们发现,当从7进入到8时;

p=it就是说p指向7;

而it可能是指向啦8;

当然也可能是指向啦5;

当找到我们的删除目标啦,我们就break;

退出for遍历,并且带着自己的老爸一起前进到下一关;

int remove(Tree *tree, int data)
{
    if(tree->root != NULL)
    {
        Node *p = NULL;
        Node *succ;
        Node *it = tree->root;
        int dir;
        for(;;){
            if( it == NULL){
                return 0;
            }else if(it->data == data){
                break;
            }
            dir = it->data < data;
            p = it;
            it = it->link[dir];
        }
/***********************************************************************/

        if(it->link[0] != NULL && it->link[1] != NULL){
            //TODO
        }else{
            //TODO
        }
    }

    return 1;
}

为啦,让我们的思路更加清晰,我们用*号分开上下部分;

第二关,看起来真是刺头,就if语句都那么长的条件;

那么它到底什么意思呢?

it->link[0] != NULL && it->link[1] != NULL

我们知道it是要删除的节点,那么它的link就是左右子树;

哦,好像意思有些明白啦;

就是说it都有孩子呗;

就好比是6.5一样,有两个儿子的情况;

如果这样的情况存在,那么6.5如果犯罪啦被执行死刑啦;

儿子是政府给养的;

所以if语句是这个意思哈;

    if(it->link[0] != NULL && it->link[1] != NULL){
            p = it;
            succ = it->link[1];
            while(succ->link[0] != NULL){
                p = succ;
                succ = succ->link[0];
            }
            it->data = succ->data;
            p->link[p->link[1] == succ] = succ->link[1];
            free(succ);

        }else{
            //TODO
        }

为了,专注我们当前的问题,我们只这部分代码;

第一,p = it保留it的一份备份;

第二,succ = it->link[1]取it的右子树;

显然,有时候大儿子可以撑一个家的;

大儿子可能已经结婚啦,而且已经有啦儿子;

所以大儿子也希望找到自己最小得儿子(左子树)来管理家庭内务;

自己要外出干活;

所以

 while(succ->link[0] != NULL){
                p = succ;
                succ = succ->link[0];
            }

往左找,一直找到最后一个,来再看一个图;

假设要删除的是6.5;

那么,首先找到7,就是succ=it->link[1];

 但是发现,让7来管理家庭内务有些大才小用;

所以就是继续往左子树找succ=succ->link[0];

找到6.8后,while(succ->link[0] != NULL)不成立,退出;

找到啦继承者6.8;

而我们知道p总是走在succ的后面,所以succ不要的就留个p;

因此p此时指向的是6.9,比succ落后一点;

毕竟parent总是没有小朋友succ跑得快的;

it->data = succ->data;

我们注意到,要删除的it节点,没有如我们想象的delete (it->data)

而是直接让继承者的数据过来覆盖掉;

因此我们的图目前应该是这样的:

两个6.8节点显然是不对的啊;

所以想办法把6.8去掉才对;

p->link[p->link[1] == succ] = succ->link[1];

这行代码也是精致啊;

succ->link[1]可能存在,也可能只是NULL;

假设存在,应该我们的树可能是这样的;

显然,我们不能直接给原来的6.8设为NULL;

人家还有儿子呢;

所以让他得儿子也继承到6.8原来的父亲下面啦;

相当于,succ自己去当县长啦,让自己的父亲p照顾一下自己的儿子;

因此,我们的代码是这样写的;

p->link[p->link[1] == succ] = succ->link[1];

p->link[p->link[1] == succ]一般是等价于p->link[0]

因为,p->link[1] 通常不会等价于succ所以通常返回0;

因此,p->link[0]=succ->link[1]就是6.9接受6.85这个孙子的抚养权的过程;

那么什么时候,p->link[1] == succ成立呢?

p = it;
succ = it->link[1];

注意看看,什么地方出现上面的代码;

你会发现,只有

while(succ->link[0] != NULL)

不执行,才会导致p->link[1]==succ成立;

也就才会返回1,也就才会让p->link[1]=succ->link[1]

看看图吧:

例如,假设删除的对象是5;

那么it指向5,而p也指向it,所以p也指向5;

succ=it->link[1]也就是说succ指向6;

继承者是6,发现while(succ->link[0] != NULL)不成立;

即,没有比6更小的啦;

可能是如下的树;

因此只能是6担当此次重任;

 

那么首先复制,6到5节点;

然后执行p->link[1]=succ->link[1];

好啦,说了那么多,休息一下下;

回顾一下我们这个函数完成的情况:

int remove(Tree *tree, int data)
{
    if(tree->root != NULL)
    {
        Node *p = NULL;
        Node *succ;
        Node *it = tree->root;
        int dir;
        for(;;){
            if( it == NULL){
                return 0;
            }else if(it->data == data){
                break;
            }
            dir = it->data < data;
            p = it;
            it = it->link[dir];
        }
/***********************************************************************/

        if(it->link[0] != NULL && it->link[1] != NULL){
            p = it;
            succ = it->link[1];
            while(succ->link[0] != NULL){
                p = succ;
                succ = succ->link[0];
            }
            it->data = succ->data;
            p->link[p->link[1] == succ] = succ->link[1];
            free(succ);
/***********************************************************************/
        }else{
            //TODO
        }
    }

    return 1;
}

不知不觉写了那么多代码啦;

可惜看到还有一个TODO你不经在想到底还有什么玩意,不能一次说清;

真是烦人,别急,再休息一会;

       }else{  /*it->link[0] == NULL || it->link[1] == NULL */
            dir = it->link[0] == NULL;
            if( p == NULL){
                tree->root = it->link[dir];
            }else{
                p->link[p->link[1] == it] = it->link[dir];
            }
            free(it);
        }

首先,判断it->link[0] == NULL;

然后判断p是否为NULL;

还记得这几行代码吗?

Node *p = NULL;
Node *succ;
Node *it = tree->root;

如果,p==NULL说明,it一直没有改变,因为p总是跟着it再改变的;

所以,此时,it任然是指向树根;

你可能大吃一斤;

不要惊讶,其意是说,我们找到啦你要删除的节点;

就是这棵树的根节点点,你确定要删除吗?

要是真的要,那么我们就给树换一个根啦;

tree->root = it->link[dir];

还要注意一个问题,要换这棵树的根的前提是;

这棵树只有一个儿子,

可能是左儿子,也可能是右儿子;

只有右儿子的情况:

 

 

只有左儿子的情况:

无论怎样,这个儿子都是直接继承啦!没人跟他争啦;

好啦再看看这个if-else语句到底还包含什么:

       if( p == NULL){
                tree->root = it->link[dir];
            }else{
                p->link[p->link[1] == it] = it->link[dir];
            }

如果p!=NULL呢?

那就是说,我们处理的节点肯定含有叶子的节点;

首先分析,it->link[dir]表示我们要删除的节点到底还有哪个儿子;

dir = it->link[0] == NULL;

还记得上面这行代码吗?如果我们的左边为空那么返回右边的儿子;

因此,你可以简单的理解dir代表着it还有的唯一一个儿子所在的位置;

这个儿子必须继承下来;

而到底继承到谁家你呢;

看it得父亲要怎么收养啦;

要是p就是树根;

it就是根的右子树;

显然,满足p->link[1]==it所以返回1

此时p->link[1]=it->link[dir];

即,19被删除啦,然后是21接上;

第二种情况,如果p->link[1]!=it呢;

这种情况是,p是19,那么it就是17要删除的节点;

p->link[1]!=17而是等于21所以返回0

因此p->link[0]=it->link[dir];

哈哈,这正是我们想要的效果;

好啦!任务总算是完成啦;

看看我们的整体成果吧;

int remove(Tree *tree, int data)
{
    if(tree->root != NULL)
    {
        Node *p = NULL;
        Node *succ;
        Node *it = tree->root;
        int dir;
        for(;;){
            if( it == NULL){
                return 0;
            }else if(it->data == data){
                break;
            }
            dir = it->data < data;
            p = it;
            it = it->link[dir];
        }
/***********************************************************************/

        if(it->link[0] != NULL && it->link[1] != NULL){
            p = it;
            succ = it->link[1];
            while(succ->link[0] != NULL){
                p = succ;
                succ = succ->link[0];
            }
            it->data = succ->data;
            p->link[p->link[1] == succ] = succ->link[1];
            free(succ);
/***********************************************************************/
        }else{  /*it->link[0] == NULL || it->link[1] == NULL */
            dir = it->link[0] == NULL;
            if( p == NULL){
                tree->root = it->link[dir];
            }else{
                p->link[p->link[1] == it] = it->link[dir];
            }
            free(it);
        }
    }

    return 1;
}

编译有错:

搞啦半天,原来已经有已经函数叫做remove啦

好吧咱们换个名字;

#include <stdio.h>
#include <stdlib.h>

typedef struct _node {
    int data;
    struct _node *link[2];
}Node;

typedef struct _tree{
    struct _node *root;
}Tree;

Tree * init_tree()
{
    Tree *temp = (Tree*)malloc(sizeof(Tree));
    temp->root = NULL;
    return temp;
}

Node * make_node(int data)
{
    Node *temp = (Node*)malloc(sizeof(Node));
    temp->link[0] = temp->link[1] = NULL;
    temp->data = data;
    return temp;
}

int insert(Tree *tree, int data)
{
    if(tree->root == NULL){
        tree->root = make_node(data);
    }else{
        Node * it = tree->root;
        int dir ;
        for(;;){
            dir = it->data < data;
            if(it->data == data){
                return 0;
            }else if(it->link[dir] == NULL){
                break;
            }
            it = it->link[dir];
        }
        it->link[dir] = make_node(data);
    }
    return 1;
}
void print_inorder_recursive(Node *root)
{
    if(root){
        print_inorder_recursive(root->link[0]);
        printf("data:%d\n",root->data);
        print_inorder_recursive(root->link[1]);
    }
    return ;
}

void print_inorder(Tree *tree)
{
    print_inorder_recursive(tree->root);
    return ;
}

int remove_node(Tree *tree, int data)
{
    if(tree->root != NULL)
    {
        Node *p = NULL;
        Node *succ;
        Node *it = tree->root;
        int dir;
        for(;;){
            if( it == NULL){
                return 0;
            }else if(it->data == data){
                break;
            }
            dir = it->data < data;
            p = it;
            it = it->link[dir];
        }
/***********************************************************************/

        if(it->link[0] != NULL && it->link[1] != NULL){
            p = it;
            succ = it->link[1];
            while(succ->link[0] != NULL){
                p = succ;
                succ = succ->link[0];
            }
            it->data = succ->data;
            p->link[p->link[1] == succ] = succ->link[1];
            free(succ);
/***********************************************************************/     
       }else{  /*it->link[0] == NULL || it->link[1] == NULL */
            dir = it->link[0] == NULL;
            if( p == NULL){
                tree->root = it->link[dir];
            }else{
                p->link[p->link[1] == it] = it->link[dir];
            }
            free(it);
        }
    }

    return 1;
}

int main(void)
{
    Tree * tree = init_tree();
    insert(tree,6);
    insert(tree,7);
    insert(tree,5);
    insert(tree,8);

    print_inorder(tree);
    puts("remove 6");
    remove_node(tree,6);
    print_inorder(tree);
    insert(tree,12);
    print_inorder(tree);
    puts("remove 5");
    remove_node(tree,5);
    print_inorder(tree);
    return 0;
}
    

最后运行结果如下:

 

Thanks:)

posted @ 2015-10-09 11:23  Landpack  阅读(1586)  评论(3编辑  收藏  举报