【图解数据结构】树及树的遍历

当你第一次学习编码时,大部分人都是将数组作为主要数据结构来学习。

之后,你将会学习到哈希表。如果你是计算机专业的,你肯定需要选修一门数据结构的课程。上课时,你又会学习到链表,队列和栈等数据结构。这些都被统称为线性的数据结构,因为它们在逻辑上都有起点和终点。

当你开始学习树和图的数据结构时,你会觉得它是如此的混乱。因为它的存储方式不是线性的,它们都有自己特定的方式存储数据。

定义

树是众所周知的非线性数据结构。它们不以线性方式存储数据。他们按层次组织数据。

树的定义

树(Tree)是n(n>=0)个结点的有限集。n=0时称为空树。

在任意一颗非空树中:

(1)有且仅有一个特定的称为根(Root)的结点。

(2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1、T2、.....、Tm,其中每一个集合本身又是一棵树,并且称为根的子树(SubTree)。

下图就符合树的定义:

其中根结点A有两个子树:

 

我们硬盘的文件系统就是很经典的树形结构。

“树”它具有以下的特点:

    ①每个节点有零个或多个子节点;

    ②没有父节点的节点称为根节点;

    ③每一个非根节点有且只有一个父节点;

    ④除了根节点外,每个子节点可以分为多个不相交的子树;

 

树( tree)是被称为结点( node)的实体的集合。结点通过边( edge)连接。每个结点都包含值或数据( value/date),并且每结节点可能有也可能没有子结点。

树的首结点叫根结点(即 root结点)。如果这个根结点和其他结点所连接,那么根结点是父结点与根结点连接的是子结点。

所有的结点都通过边连接。它是树中很重要得一个概念,因为它负责管理节点之间的关系。

叶子结点是树末端,它们没有子结点。像真正的大树一样,我们可以看到树上有根、枝干和树叶。

术语汇总 

  • 根结点是树最顶层结点

  • 边是两个结点之间的连接

  • 子结点是具有父结点的结点

  • 父结点是与子结点有连接的结点

  • 叶子结点是树中没有子结点的结点(树得末端)

  • 高度是树到叶子结点(树得末端)的长度

  • 深度是结点到根结点的长度

 

树的结点

树的结点包含一个数据元素及若干指向其子树的分支

结点拥有的子树数称为结点的度(Degree)

树的度是树内各结点度的最大值。

 

 结点的层次从根开始定义起,根为第一层,根的孩子为第二层,以此类推,若某结点在第 i 层,则其子树的根就在第 i+1 层。

其双亲在同一层的结点互为堂兄弟。显然下图中的D、E、F是堂兄弟,而G、H、l、J也是。

树的深度(Depth)或高度是树中结点的最大层次。 

 

树的高度( height)和深度( depth)

  • 树的高度是到叶子结点(树末端)的长度,也就是根结点到叶子结点的最大边长度

  • 结点的深度是它到根结点的长度,也就是层次

 

 

树的存储结构

 

 

 双亲表示法

在每个结点中,附设一个指示器指示其双亲结点到链表中的位置。

 

  

 

优点:parent指针域指向数组下标,所以找双亲结点的时间复杂度为O(1),向上一直找到根节点也快
缺点:由上向下找就十分慢,若要找结点的孩子或者兄弟,要遍历整个树

 

孩子表示法

 

 

优点:找孩子比较容易

缺点:占用了大量不必要的孩子域空指针。 若要找结点的父亲,要遍历整个树。

 

改进一:为每个结点添加一个结点度域,方便控制指针域的个数

 

 缺点:维护困难,不易实现   

 

改进二:结合顺序结构和链式结构

把所有结点先放在数组里面,每个结点都会有自己的子结点,第一个孩子就用一个指针表示,每个孩子的next指针指向它的兄弟

 

 

孩子兄弟表示法

任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。因此,我们设置两个指针 ,分别指向该结点的第一个孩子和此结点的右兄弟

 

 

 

二叉树

二叉树的定义 

二叉树(Binary Tree)是n(n>=0)个结点的有限集合,该集合或者为空集(空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成(子树也为二叉树)。

二叉树的特点

  • 每个结点最多有两棵子树,所以二叉树中不存在度大于2的结点。
  • 左子树和右子树是有顺序的,次序不能任意颠倒。
  • 即使树中某结点只有一棵子树,也要区分它是左子树还是右子树。

二叉树五种基本形态

  1、空二叉树

  2、只有一个根结点

  3、根结点只有左子树

  4、根结点只有右子树

  5、根结点既有左子树又有右子树

几种特殊的二叉树

斜树

左斜树:  右斜树:

 

 

满二叉树

 

满二叉树:

 

 

完全二叉树

完全二叉树:

 

二叉树的性质

二叉树性质1

性质1:在二叉树的第i层上至多有2i-1个结点(i>=1)

二叉树性质2

性质2:深度为k的二叉树至多有2k-1个结点(k>=1)

N=2K-1    K是层次/高度(4)   N=15

二叉树性质3

性质3:对任何一棵二叉树T,如果其终端结点数为n0,度为2的结点数为n2,则n0 = n2+1。

一棵二叉树,除了终端结点(叶子结点),就是度为1或2的结点。假设n1度为1的结点数,则数T 的结点总数n=n0+n1+n2。我们再换个角度,看一下树T的连接线数,由于根结点只有分支出去,没有分支进入,所以连接线数为结点总数减去1。也就是n-1=n1+2n2,可推导出n0+n1+n2-1 = n1+2n2,继续推导可得n0 = n2+1。

二叉树性质4

性质4:具有n个结点的完全二叉树的深度为[log2n +1] ([X]表示不大于X的最大整数)。

2K=N+1     N是结点数(15)

K=log2n+1  <  log2n+1

由性质2可知,满二叉树的结点个数为2k-1,可以推导出满二叉树的深度为k=log2(n + 1)。对于完全二叉树,它的叶子结点只会出现在最下面的两层,所以它的结点数一定少于等于同样深度的满二叉树的结点数2k-1,但是一定多于2k-1 -1。因为n是整数,所以2k-1 <= n < 2k,不等式两边取对数得到:k-1 <= log2n <k。因为k作为深度也是整数,因此 k= [log2n ]+ 1。

二叉树性质5

性质5:如果对一颗有n个结点的完全二叉树(其深度为 [ log2n+1 ] )的结点按层序编号(从第1层到第 [log2n+1] 层,每层从左到右),对任一结点 i (1<=i<=n) 有:

  1. 如果i=1,则结点i是二叉树的根,无双亲;如果 i>1,则其双亲是结点 [ i / 2 ]。    双亲结点的编号 = 两个子结点中的一个子结点  / 2

  2. 如果2i>n,则结点i无左孩子(结点i为叶子结点);否则其左孩子是结点2i
  3. 如果2i+1>n,则结点 i 无右孩子;否则其右孩子是结点2i+1

结合下图很好理解:

 

 

二叉树的存储结构

二叉树顺序存储结构

一般二叉树:

^ 代表不存在的结点。

 

二叉链表

链表每个结点包含一个数据域和两个指针域:

mark

其中data是数据域,lchild和rchild都是指针域,分别指向左孩子和右孩子。

mark

 

二叉树的遍历

深度优先搜索(Depth-First Search,DFS)

DFS 在回溯和搜索其他路径之前找到一条到叶节点的路径。让我们看看这种类型的遍历的示例。

输出结果为: 1–2–3–4–5–6–7

为什么?

让我们分解一下:

  1. 从根结点(1)开始。输出

  2. 进入左结点(2)。输出

  3. 然后进入左孩子(3)。输出

  4. 回溯,并进入右孩子(4)。输出

  5. 回溯到根结点,然后进入其右孩子(5)。输出

  6. 进入左孩子(6)。输出

  7. 回溯,并进入右孩子(7)。输出

  8. 完成

当我们深入到叶结点时回溯,这就被称为 DFS 算法。

既然我们对这种遍历算法已经熟悉了,我们将讨论下 DFS 的类型:前序、中序和后序。

前序遍历

这和我们在上述示例中的作法基本类似。

  1. 输出节点的值

  2. 进入其左结点并输出。当且仅当它拥有左结点。

  3. 进入右结点并输出之。当且仅当它拥有右结点

 代码实现 -- 迭代实现

/**
 * 前序遍历--迭代
 */
public void preOrder(TreeNode node) {
    if (node == null) {
        return;
    } else {
        System.out.println("preOrder data:" + node.getData());
        preOrder(node.leftChild);
        preOrder(node.rigthChild);
    }
}

 

前序遍历 - -栈实现

/**
 * 前序遍历--栈
 *
 * @param node
 */
public void nonRecOrder(TreeNode node) {
    if (root == null) {
        return;
    }
    Stack<TreeNode> stack = new Stack<>();
    stack.push(node);
    while (!stack.isEmpty()) {
        //出栈和进栈
        TreeNode n = stack.pop();//弹出根节点
        //压入子结点
        System.out.println("nonRecOrder data: " + n.getData());
        //避免叶子结点为空,出现空指针异常
        if (n.rigthChild != null) {
            stack.push(n.rigthChild);
        }
        if (n.leftChild != null) {
            stack.push(n.leftChild);
        }
    }
}

 

 

中序遍历

 

 

示例中此树的中序算法的结果是3–2–4–1–6–5–7。

左结点优先,之后是中间,最后是右结点。

 代码实现:

/**
 * 中序遍历--迭代
 */
public void midOrder(TreeNode node) {
    if (node == null) {
        return;
    } else {
        midOrder(node.leftChild);
        System.out.println("midOrder data:" + node.getData());
        midOrder(node.rigthChild);
    }
}

 

 

后序遍历

以此树为例的后序算法的结果为 3–4–2–6–7–5–1 。

左结点优先,之后是右结点,根结点的最后。

 代码实现:

/**
     * 后序遍历--迭代
     */
    public void

    postOrder(TreeNode node) {
        if (node == null) {
            return;
        } else {
            postOrder(node.leftChild);
            postOrder(node.rigthChild);
            System.out.println("postOrder data:" + node.getData());
        }
    }

 

 

自创遍历小技巧(附链接)

先根遍历法(超级简单小技巧)

 

 

三角形遍历法

 

 

 结果: G D  I H B A E J C F

 

例子:

上图二叉树遍历结果

    前序遍历:ABCDEFGHK

    中序遍历:BDCAEHGKF

    后序遍历:DCBHKGFEA

 

posted @ 2019-09-26 14:54  小中配奇  阅读(5511)  评论(2编辑  收藏  举报