数据结构-树

数据结构--树

概念

树是一种递归定义的数据结构，是一种重要的非线性数据结构，树可以是一棵空树，它没有任何结点，也可以是一课非空树，至少含有一个结点。

遍历方式

前序遍历：
先访问根节点，再访问左子树，最后访问右子树

中序遍历：
先访问左子树，再访问根节点，最后访问右子树

后序遍历：
先访问左子树，再访问右子树，最后访问根节点

层序遍历：
每一层从左到右访问每一个节点。

举例说明:(以下面的二叉树来说明这四种遍历)

前序遍历：ABDFGHIEC
中序遍历：FDHGIBEAC
后序遍历：FHIGDEBCA
层序遍历：ABCDEFGHI

树的种类

二叉树

（1）二叉树是每个节点最多有两个子树的树结构；
（2）二叉树的子树有左右之分，次序不能颠倒；
（3）二叉树的第i层至多有2^{i-1}个结点；
（4）深度为k的二叉树至多有2^k-1个结点；
（5）对任何一棵二叉树T，如果其终端结点数为n0，度为2的结点数为n2，则n0=n2+1。

满二叉树：是深度为k，且有2^k-1个节点的二叉树。

完全二叉树：深度为k，有n个节点的二叉树，其每一个节点都与深度为k的满二叉树中，序号为1至n的节点对应。

AVL平衡二叉树：是一棵空树或它的左右两个子树的高度差的绝对值不超过1，并且左右两个子树都是一棵平衡二叉树。

线索二叉树：n个结点的二叉链表中含有n+1(2n-(n-1)=n+1)个空指针域。利用二叉链表中的空指针域，存放指向结点在某种遍历次序下的前趋和后继结点的指针（这种附加的指针称为"线索"）。线索二叉树可分为前序线索二叉树、中序线索二叉树和后序线索二叉树三种。

二叉排序树：
（1）若左子树不空，则左子树上所有结点的值均小于它的根节点的值；
（2）若右子树不空，则右子树上所有结点的值均大于它的根结点的值；
（3）左、右子树也分别为二叉排序树；
（4）没有键值相等的节点。

哈夫曼树

哈夫曼树是一种最优二叉树，利用哈夫曼树寻找一颗最佳判定树，即总的比较次数最少的判定树。
所以，哈夫曼树中不存在结点度为1的结点。
哈夫曼树不是满二叉树，是正则二叉树（也叫正规二叉树），其中只有度为0和度为2的结点，因为n0 = n2 + 1，所以n个叶子的正则二叉树自然只有2n-1个结点。至于满二叉树当然也是正则二叉树的特例。

红黑树

AVL是严格平衡树，因此在增加或者删除节点的时候，根据不同情况，旋转的次数比红黑树要多；
红黑是弱平衡的，用非严格的平衡来换取增删节点时候旋转次数的降低；
所以简单说，搜索的次数远远大于插入和删除，那么选择AVL树，如果搜索，插入删除次数几乎差不多，应该选择RB树。
红黑树上每个结点内含五个域，color，key，left，right，p。如果相应的指针域没有，则设为NIL。
一般的，红黑树，满足以下性质，即只有满足以下全部性质的树，我们才称之为红黑树：
1）每个结点要么是红的，要么是黑的。
2）根结点是黑的。
3）每个叶结点，即空结点（NIL）是黑的。
4）如果一个结点是红的，那么它的俩个儿子都是黑的。
5）对每个结点，从该结点到其子孙结点的所有路径上包含相同数目的黑结点。
红黑树插入操作的平均时间复杂度为O（logn）,最坏时间复杂度为O（logn）;

B-树

是一种平衡多路搜索树（并不是二叉的）：
1.定义任意非叶子结点最多只有M个儿子；且M>2；
2.根结点的儿子数为[2, M]；
3.除根结点以外的非叶子结点的儿子数为[M/2, M]；
4.每个结点存放至少M/2-1（取上整）和至多M-1个关键字；（至少2个关键字）
5.非叶子结点的关键字个数=指向儿子的指针个数-1；
6.非叶子结点的关键字：K[1], K[2], …, K[M-1]；且K[i] < K[i+1]；
7.非叶子结点的指针：P[1], P[2], …, P[M]；其中P[1]指向关键字小于K[1]的
子树，P[M]指向关键字大于K[M-1]的子树，其它P[i]指向关键字属于(K[i-1], K[i])的子树；
8.所有叶子结点位于同一层；

B+ 树

B+树是B-树的变体，也是一种多路搜索树：
1.其定义基本与B-树同，除了：
2.非叶子结点的子树指针与关键字个数相同；
3.非叶子结点的子树指针P[i]，指向关键字值属于[K[i], K[i+1])的子树
（B-树是开区间）；
5.为所有叶子结点增加一个链指针；
6.所有关键字都在叶子结点出现；
如：（M=3）

B+的搜索与B-树也基本相同，区别是B+树只有达到叶子结点才命中（B-树可以在
非叶子结点命中），其性能也等价于在关键字全集做一次二分查找；
B+的特性：
1.所有关键字都出现在叶子结点的链表中（稠密索引），且链表中的关键字恰好
是有序的；
2.不可能在非叶子结点命中；
3.非叶子结点相当于是叶子结点的索引（稀疏索引），叶子结点相当于是存储
（关键字）数据的数据层；
4.更适合文件索引系统；比如对已经建立索引的数据库记录，查找10<=id<=20，那么只要通过根节点搜索到id=10的叶节点，之后只要根据叶节点的链表找到第一个大于20的就行了，比B-树在查找10到20内的每一个时每次都从根节点出发查找提高了不少效率。

B+树插入操作的平均时间复杂度O（logn）,最坏时间复杂度为O（logn）;

posted @ 2017-06-05 21:43 self-imporvement 阅读(336) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部