【数据结构&算法】11-树基础&二叉树遍历


前言

主要描述二叉树。

李柱明博客:https://www.cnblogs.com/lizhuming/p/15487394.html

树的定义

树:

  • 树是 n(n>=0) 个结点的有限集。
  • n = 0 时为空树。
  • n > 0 时,即是非空树时,有且仅有一个根结点。
  • m > 0 时,子树的个数没有限制,但它们一定互不相交。

结点:

  • 结点的度:结点拥有的子树数。

  • 叶结点或终结点:度为 0 的结点。

  • 非终结点或分支结点:度不为 0 的结点。

  • 内部结点:除根结点外,分支结点也称为内部结点。

  • 树的度:树内各结点的度的最大值。

结点关系:

  • 孩子(child):结点的子树的根称为该结点的孩子。
  • 双亲(parent):该结点称为孩子的双亲(父母同体,唯一的一个)。
  • 兄弟(sibling):同一个双亲的孩子之间互称兄弟。
  • 祖先:结点的祖先是从根到该结点所经分支上的所有结点。
  • 子孙:以某结点为根的子树中的任一结点都称为该节点的子孙。

树的其它相关概念:

  • 层次(level):从根开始定义起,根为第一层,根的孩子为第二层。
  • 堂兄弟:双亲在同一层的结点互为堂兄弟。
  • 深度(depth)或高度:树中结点的最大层次称为树的深度或高度。
  • 有序树/无序树:如果将树中结点的各子树看成从左至右有次序的,不能互换的,则称该树为有序树,否则为无序树。
  • 森林(forest):m(m>=0)棵互不相交的树的集合。

树的存储结构

简单的顺序存储结构无法直接反映逻辑关系,不能满足树的实现要求。

故充分利用顺序存储和链式存储结构的特点,介绍三种不同的表示法:

  1. 双亲表示法。
  2. 孩子表示法。
  3. 孩子兄弟表示法。

双亲表示法

引入:除根节点外,其余每个结点,不一定有孩子,但一定有且仅有一个双亲
定义:设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点到链表中的位置。

  • data:数据域,存储结点的数据信息。
  • parent:指针域,存储该结点的双亲在数组中的下标。
  • 约定:根节点的位置域为-1。

缺点:

  1. 找一个结点的孩子需要遍历树。

上述第一个缺点引发的思考:

  1. 需要关注什么数据域就在数据结构中添加什么数据域。如双亲域、长子域、兄弟域等等。

    1. 如需要关注结点的孩子,则添加结点的长子域。

参考代码:

/* 树的双亲表示法结点数据结构 */
#define MAX_TREE_SIZE 100
typedef int tree_elem_type;

/* 结点结构 */
typedef struct tree_node
{
    int parent; // 双亲位置
    // int firstchild; // 长子位置
    // int rightsib; // 右兄弟位置
    tree_elem_type data; // 数据
}tree_node_t;

/* 树结构 */
typedef struct tree
{
    int root; // 根节点位置
    int num; // 当前节点数
    tree_node_t nodes[MAX_TREE_SIZE];
}tree_t;

孩子表示法

多重链表表示法:

  • 每个结点有多个指针域,其中每个指针指向一棵子树的根节点,这种方法叫做多重链表表示法。

方案 1:

  • 设置指针域的个数为树的度。
  • 即是结点数据结构的内容为:data 和 n(树的度)个孩子域。
  • 特点:可能存在空间浪费。

方案 2:

  • 设置每个结点指针域的个数等于该结点的度,取一个位置来存储结点指针域的个数。
  • 特点:空间利用率提高,但是各个结点的链表结构不同,要维护结点的度的数值,时间损耗提高。

孩子表示法:

  • 把每个结点的孩子结点排列起来,以单链表作存储结构,则 n 个结点有 n 个孩子链表,如果是叶子结点,则此单链表为空。然后 n 个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中。

  • 孩子表示法的两种结点数据结构:

    1. 孩子链表的孩子结点:
      1. child:表示该孩子结点在表头数组中的下标。
      2. next:下一个孩子结点的指针。
    2. 表头数组的表头结点:
      1. data:数据域。
      2. firstchild:孩子链表头指针。
  • 缺点:找双亲需要遍历树。

    • 解决:表头数组的表头结点数据结构添加双亲域。

参考代码:

/* 树的孩子表示法结点数据结构 */
#define MAX_TREE_SIZE 100
typedef int tree_elem_type;

/* 孩子结点结构 */
typedef struct c_tree_node
{
    int child; // 孩子下标
    struct c_tree_node *next; // 下一个
}c_tree_node_t;

/* 表头结构 */
typedef struct tree_top
{
    c_tree_node_t *firstchild; // 头结点
    tree_elem_type data; // 数据
}tree_top_t;

/* 树结构 */
typedef struct tree
{
    int root; // 根节点位置
    int num; // 当前节点数
    tree_top_t nodes[MAX_TREE_SIZE];
}tree_t;

孩子兄弟表示法

引入:

  • 任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。
  • 所以可以设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。

参考代码:

/* 树的孩子兄弟表示法结点数据结构 */
typedef int tree_elem_type;

typedef struct tree_node
{
    struct tree_node *firstchild; // 长子域
    struct tree_node *rightsib; // 右兄域
    tree_elem_type data; // 数据
}tree_node_t;

二叉树

定义

二叉树的定义:

  • 二叉树是 n(n>=0) 个结点的有限集合,该集合或为空集,或由一个根结点和两颗互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
  • 是有序树。

特点

二叉树特点:

  • 二叉树中不存在大于 2 的结点。
  • 左子树和右子树是有序树。
  • 只有一颗子树也要区分左右子树。

形态

二叉树的五种基本形态:

  1. 空二叉树。
  2. 只有一个根结点。
  3. 根结点只有左子树。
  4. 根结点只有右子树。
  5. 根结点有左、右子树。

特殊二叉树

斜树

左斜树&右斜树:

  • 左斜树:

  • 右斜树:

满二叉树

满二叉树:

  • 定义:所有分支结点都存在左右子树,并且所有叶子都在同一层。

  • 特点:

    • 叶子只能出现在最下一层。
    • 非叶子结点的度一定是 2。
    • 在同样深度的二叉树中,满二叉树的结点个数最多,叶子树最多。

完全二叉树

完全二叉树:

  • 定义:对一棵具有 n 个结点的二叉树按层序编号,如果编号 i(1<=i<=n)的结点与同样深度的满二叉树中编号为 i 的结点在二叉树中位置完全相同,则此二叉树为完全二叉树。

  • 特点:

    • 叶子结点只能出现在最下两层。
    • 最下层的叶子一定集中在左边连续位置。
    • 倒数第二层若有叶子结点,一定都在右边连续位置。
    • 若结点的度为 1,则该结点只有左孩子。即是不存在只有右子树的情况。
    • 同样结点数的二叉树,完全二叉树的深度最小。
  • 判断方法:给每个结点按满二叉树的结构逐层排序,如果编号出现空档,就不是,否则就是。

二叉树的性质

性质 1:在二叉树的第 i 层上至多有 2i-1 个结点(i>=1)。

性质 2:深度为 k 的二叉树至多有 2k-1 个结点(k>=1)。

性质 3:对任何一棵二叉树 T,如果其终端结点数为 n0,度为 2 的结点数为 n2,则 n0 = n2+1。

性质 4:具有 n 个结点的完全二叉树的深度为[log2n ] + 1([X]表示不大于 X 的最大整数)。

性质 5:如果对一颗有 n 个结点的完全二叉树(其深度为[log2n ] + 1)的结点按层序编号(从第 1 层到第[log2n ] + 1 层,每层从左到右),对任一结点 i(1<=i<=n)有:

  1. 如果 i=1,则结点 i 是二叉树的根,无双亲。
  2. 如果 i>1,则其双亲是结点[i/2]。
  3. 如果 2i>n,则结点 i 无左孩子(结点 i 为叶子结点);否则其左孩子是结点 i。
  4. 如果 2i+1>n,则结点 i 无右孩子;否则其右孩子是结点 2i+1。

二叉树的存储结构

有顺序存储结构和链式存储结构。

二叉树的顺序存储结构

二叉树的顺序存储结构:

  • 存储方法:按完全二叉树编号,编号就是下标。
  • 缺点:当树不为完全二叉树时存在空间浪费。

二叉树的链式存储结构

二叉树的链式存储结构:

  • 链表每个结点包含一个数据域和两个指针域:

    • data:数据
    • lchild:左孩子
    • rchild:右孩子

二叉树的遍历

遍历是二叉树中非常重要的操作。

遍历原理

二叉树的遍历是指从根结点出发,按照某种次序依次访问二叉树中的所有结点,使得每个结点都被访问 1 次。

遍历方法

四种遍历方法:

  1. 前序遍历
  2. 中序遍历
  3. 后序遍历
  4. 层序遍历

前、中、后序表示的是节点与它的左右子树节点遍历打印的先后顺序。

实现思路:递归。

前序遍历

前序遍历是指,对于树中的任意节点来说,先打印这个节点,然后再打印它的左子树,最后打印它的右子树。

代码实现思路:

  • 中-> 左 -> 右。使用栈辅助实现。

    1. 方法 1:使用递归思想。(相当于使用系统栈)
    2. 方法 2:非递归,采用自实现的栈辅助。

参考代码(递归):

/* 顺序存储结构 */
void pre_order_traverse(bi_tree tree,int e)
{ 
    visit(tree[e]); // 打印父节点

    if(tree[2*e+1]!=nil) /* 左子树不空 */
    	pre_traverse(tree,2*e+1); // 递归
  
    if(tree[2*e+2]!=nil) /* 右子树不空 */
	pre_traverse(tree,2*e+2); // 递归
}

/* 链式存储结构 */
void pre_order_traverse(bi_tree *tree)
{ 
    if(tree==NULL)
	return;

    printf("%c",tree->data);/* 显示结点数据,可以更改为其它对结点操作 */
    pre_order_traverse(tree->lchild); /* 再先序遍历左子树 */
    pre_order_traverse(tree->rchild); /* 最后先序遍历右子树 */
}
中序遍历

中序遍历是指,对于树中的任意节点来说,先打印它的左子树,然后再打印它本身,最后打印它的右子树

代码实现思路:

  • 左-> 中 -> 右。使用栈辅助实现。

    1. 方法一:使用递归思想。
    2. 方法 2:非递归,采用自实现的栈辅助。

参考代码(递归):

/* 顺序存储结构 */
void in_order_traverse(bi_tree tree,int e)
{ 
    if(tree[2*e+1]!=nil) /* 左子树不空 */
    	in_traverse(tree,2*e+1); // 递归
  
    visit(tree[e]); // 打印父节点

    if(tree[2*e+2]!=nil) /* 右子树不空 */
	in_traverse(tree,2*e+2); // 递归
}

/* 链式存储结构 */
void in_order_traverse(bi_tree *tree)
{ 
    if(tree==NULL)
        return;

    in_order_traverse(tree->lchild); /* 再先序遍历左子树 */
    printf("%c",tree->data);/* 显示结点数据,可以更改为其它对结点操作 */
    in_order_traverse(tree->rchild); /* 最后先序遍历右子树 */
}
后序遍历

后序遍历是指,对于树中的任意节点来说,先打印它的左子树,然后再打印它的右子树,最后打印这个节点本身。

代码实现思路:

  • 左-> 右 -> 中。

    1. 使用递归思想。
    2. 方法 2:非递归,采用自实现的栈辅助。

参考代码(递归):

/* 顺序存储结构 */
void post_order_traverse(bi_tree tree,int e)
{ 
    if(tree[2*e+1]!=nil) /* 左子树不空 */
    	post_traverse(tree,2*e+1); // 递归

    if(tree[2*e+2]!=nil) /* 右子树不空 */
	post_traverse(tree,2*e+2); // 递归

    visit(tree[e]); // 打印父节点
}

/* 链式存储结构 */
void post_order_traverse(bi_tree *tree)
{ 
    if(tree==NULL)
        return;

    post_order_traverse(tree->lchild); /* 再先序遍历左子树 */
    post_order_traverse(tree->rchild); /* 最后先序遍历右子树 */
    printf("%c",tree->data);/* 显示结点数据,可以更改为其它对结点操作 */
}
层序遍历

根起,从上而下,从左至右。

对于顺序存储,只需要按下标顺序输出即可。

但是对于链式存储结构就复杂点,思路如下:借助队列的方式实现:

  1. 先把跟节点入队。
  2. 获取队头并打印,然后把当前队头节点的左右孩子入队。
  3. 重复步骤 2。
/* 顺序存储结构:直接打印数组 */
void level_order_traverse(bi_tree tree)
{ 
    int i=MAX_TREE_SIZE-1;
    int j=0;

    while(tree[i]==nil)
	i--; /* 找到最后一个非空结点的序号 */
  
    for(j=0;j<=i;j++)  /* 从根结点起,按层序遍历二叉树 */
	if(tree[j]!=nil)
            visit(tree[j]); /* 只遍历非空的结点 */
  
    printf("\n");
}

/* 链式存储结构:借助队列 */
void level_order_traverse(bi_tree_node* tree)
{ 
    bi_tree_node* temp = NULL;

    queue_push(tree); // 跟节点入队

    while (!queue_empty())
    {
        temp = queue_pop();

        printf("%d ", temp->data);  //输出队首结点

        if (temp->left)     //把Pop掉的结点的左子结点加入队列
            queue_push(temp->left);

        if (temp->right)    // 把Pop掉的结点的右子结点加入队列
            queue_push(temp->right);
    }
}

二叉树的建立

二叉树的扩展二叉树:

  • 为了能让每个结点确认是否有左右孩子,将每个结点的空指针引出一个虚结点,其值为一特定值,比如"#"
  • 这种处理后的二叉树为原二叉树的扩展二叉树。
  • 扩展二叉树就可以做到一个遍历序列确定一棵二叉树。

树、森林和二叉树的转换

树转换为二叉树

二叉树除了根节点,其余节点最多有三条线:

  1. 与双亲。(注意:在该节点上没有双亲域)
  2. 做孩子。
  3. 右孩子。

树转换为二叉树的步骤:

  1. 加线:所有兄弟结点之间加一条线。

  2. 去线:对树中每个结点,只保留与第一个孩子的线。删除与其它孩子的线。

  3. 层次调整:

    • 第一个孩子是二叉树的左孩子
    • 右兄弟是右孩子

森林转换为二叉树

森林转换为二叉树的步骤:

  1. 把每棵树都转换为二叉树。
  2. 从第二棵树起,将其根节点插入到前一棵树的根节点作为其右孩子。

二叉树转换为树

二叉树转为树的步骤:

  1. 加线:当前节点与左孩子的右孩子、左孩子的右孩子的右孩子、左孩子的右孩子的右孩子的右孩子......连线。
  2. 去线:去掉原二叉树中所有节点与其右孩子的连线。
  3. 层次调整。

二叉树转换为森林

二叉树的根节点有右孩子,则说明该二叉树可以就可以转换为森林。

二叉树转换为森林的步骤:

  1. 去线:从根节点其,取出根节点与右孩子的线,得出的右孩子树,也去除与右孩子的线,循环下去直至右孩子树没有右孩子为止。
  2. 将每棵二叉树转换为树。

树和森林的遍历

树的遍历

树的遍历有两种:

  1. 先序遍历:先访问根再依次访问子。
  2. 后序遍历:先访问依次访问子,再访问根。

森林的遍历

森林的遍历也有两种:

  1. 先序遍历:一棵树先序遍历完再下一棵树。
  2. 后序遍历:一棵树后序遍历完再下一棵树。
posted @ 2021-11-11 09:03  李柱明  阅读(511)  评论(2编辑  收藏  举报