<数据结构>笔记1-【B树和索引】
一、二叉排序树(二叉查找树)
空树或具有下列性质的二叉树
1.左子树所有节点值小于根节点
2.右子树所有节点大于根节点
3.它的左右子树分别为二叉排序树
二、平衡二叉树(AVL树)
- 满足二叉排序树
- 左右子树高度相差不超过1
三、B-树
- 平衡
- 多路排序树
- 主要用于文件索引
1. 特性:
1)所有非终端节点包含以下信息(key-value paris)
(n,A0,K1,A1,K2,A2...Kn,An) **
Ki--关键字
Ai--指向子树根节点指针
n--关键字个数
2)所有叶节点出现在同一层,包含关键字 或 指向关键字记录的指针
关键字记录?
关键字key为记录的主键,只是记录的一部分。
The term leaf is also inconsistent.
Bayer & McCreight (1972) considered the leaf level to be the lowest level of keys, but Knuth considered the leaf level to be one level below the lowest keys (Folk & Zoellick 1992, p. 363).
There are many possible implementation choices.
In some designs, the leaves may hold the entire data record;
in other designs, the leaves may only hold pointers to the data record. Those choices are not fundamental to the idea of a B-tree.[5]
《数据结构》严蔚敏版 此处有误
3)树中每个节点保存值
B-trees keep values in every node in the tree, and may use the same structure for all nodes.
2. B-树查找分析
通常存储在磁盘
两步操作:
1) 找节点(磁盘)
磁盘随机找到p所指节点,并将节点信息读入内存
2) 节点中找关键字(内存)
顺序查找或折半查找关键字
四、B+树
A B+ tree can be viewed as a B-tree in which each node contains only keys (not key–value pairs), and to which an additional level is added at the bottom with linked leaves.
note
12..34..567 are leaves,d1~d7 are not——they are data record.
与B-树不同点:
1. 所有叶子节点
1). 包含 全部关键字
2). 包含关键字记录指针,如上图12..34..567
3). 叶子节点升序顺序链表链接
2. 非终端节点(即索引)只含关键字,非B树的关键字-指针对
3. 其他
- n棵子树含n个关键字
- 两指针与查找:
- root节点指针-->随机查找(必须,搜索总是从root节点开始,代替全表扫描)
- 最小关键字叶子节点指针-->顺序查找
五、文件
1. 记录2种结构
逻辑结构和物理结构
2. 文件3种检索方式
顺序检索
存取下一个逻辑记录
直接检索
存取第i个逻辑记录
关键字检索
查询与关键字相关记录
六、 索引文件
1. 索引表
记录逻辑记录和物理记录对应关系
索引项
- 定义:索引表中的项
- 索引项按关键字或逻辑记录号排序
2. 索引文件
索引文件只能是磁盘文件
1)定义:
文件数据区+索引表
2)分类:
索引顺序文件--数据区有序
索引非顺序文件--数据区无序
3)索引文件检索
两步骤:
- 查索引表(折半)
- 查记录(依据索引项)
- 数据小--索引表在内存,记录在外存
- 数据大--索引、记录均在外存