D14-多路查找树[Java数据结构和算法]

1. 二叉树和B树

  1.1二叉树的问题分析

  (1)二叉树需要加载到内存,若二叉树的节点少不存在什么问题;

  (2)若节点较多,在构建二叉树时,需要多次进行I/O操作,节点海量,构建二叉树时,速度有影响;

  (3)节点海量,会造成二叉树的高度很大,会降低操作速度;

  1.2 多叉树(multiway tree)

  (1)允许每个节点可以有更多的数据项和更多的子节点;

  (2)2-3树,2-3-4树就是多叉树,多叉树通过重新组织节点,减少树的高度,能对二叉树进行优化;

  1.3 B树  

  (1)B树通过重新组织节点,降低树的高度;

  (2)文件系统及数据库系统的设计者利用了磁盘预读原理,将一个节点的大小设置为等于一个页(页的大小通常为4k),通过每个节点只需要一次I/O就可以完全载入;

  (3)将树的度M设置为1024,在600亿个元素中最多只需要4次I/O操作就可以读取到想要的元素,B树和B+树广泛应用于文件存储系统和数据库系统中;

  1.4 2-3树

  (1)2-3树时最简单的B树结构;

  (2)2-3树的所有叶子节点都在同一层,只要是B树就满足这个条件;

  (3)有两个子节点的节点叫做二节点,二节点要么没有子节点,要么有两个子节点;

  (4)有三个子节点的节点叫做三节点,三节点要么没有子节点,要么有三个子节点;

  (5)2-3树是由二节点和三节点构成的树;

 

2. 2-3树的构成原理

  2.1构成规则

  (1)当按照规则插入一个数到某个节点,若不满足2-3树的特征要求,就要进行拆分,先向上拆,如果上层满,就拆本层,拆后仍然要满足2-3树的特征;

  (2)对于三节点的子树值仍然要遵守BST的规则;

   构建规则详见:https://juejin.im/post/5b7e00456fb9a01a0b3193c7

  构建数据为[16,24,12,32,14,26,34,10,8,28,38,20]图解:

 

3 B树,B+树和B*树

  3.1 B-tree树即B树

  3.2 B树的说明

  (1)B树的阶:节点的最多子节点的个数;

  (2)B树的搜索是从根节点开始的,对节点内的关键字序列进行二分查找,若命中就结束,否则进入查询关键字所属范围的儿子节点;重复,知道所对应的儿子指针为空,或已经是叶子节点;

  (3)关键字集合分布在整棵树中,即叶子节点和非叶子节点都存放数据;

  (4)搜索有可能在非叶子节点结束

  (5)其搜索性能等价于在关键字全集内做一次二分查找;

  3.3 B+树:是B树的变体

  (1)B+树的搜索与B树基本相同,区别是B+树只有达到叶子节点才命中,其性能也等价于在关键字全集做一次二分查找;

  (2)所有关键字都出现在叶子节点的链表中,且链表中的关键字数据恰好是有序的;

  (3)不可能在非叶子节点命中;

  (4)非叶子节点相当于是叶子节点的索引(稀疏索引),叶子节点相当于是存储数据的数据层;

  (5)更适合文件索引系统;

  (6)B树和B+树各自有自己的应用场景;

  3.4 B*树:是B+树的变体,在B+树的非根和非叶子节点再增加指向兄弟的指针;

  (1)B*树定义了非叶子节点关键字个数至少为(2/3)*M,即块的最低使用率为2/3,而B+树的块的最低使用率为1/2;

  (2)B*树分配新节点的概率比B+树要低,空间使用率更高;

posted on 2019-08-19 17:11  ERFishing  阅读(288)  评论(0编辑  收藏  举报