mysql索引本质

一、索引帮助mysql高效获取数据排好序的数据结构。

二、索引存储位置：磁盘文件。

三、索引结构：二叉树、红黑树、hash、BTree、B+Tree 。索引结构为了更快找到目标数据。

四、数据结构

4.1、二叉树

定义：每个结点最多有两个子树，左子树比父节点小，右子树比父节点大。

缺点：会出现极端情况导致整棵树只有左子树或只有右子树。

图：

4.2、红黑树

定义：

性质1. 节点是红色或黑色。

性质2. 根节点是黑色。

性质3 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)

性质4. 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。

缺点：数据量大会导致树层数比较多，这样就会造成查找数据慢。

图：

4.3、hash数据结构

定义：散列表（Hash table，也叫哈希表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。对目标值进行hash运算得到hash值和数据磁盘指针地址保存到hash表，这样就达到快速定位数据位置。

缺点：精确查找十分快速，但范围查找就碰壁了。

图：无

4.4、BTree

定义：一个节点可以存储多个数据，这样可以避免黑红树的缺点，树的层数很变小。

缺点：节点里面数组数据：每个数据的结构=索引数据+数据记录（即叶子节点存储键值和数据记录）。

图：

4.5、B+Tree

定义：B+Tree是在B-Tree基础上的一种优化。节点里面数组数据：每个数据只存储键信息，这样不存数据可以腾出空间放更多的键信息，让树层数越小。

非叶子节点只存储键信息。
所有叶子节点之间都有一个链指针。
数据记录都存放在叶子节点中。

缺点：无

图：

五、mysql采用B+Tree数据结构存储数据

5.1、B+TREE叶子节点指针作用：定位值比它大的叶子节点。

5.2、引申出为什么mysql "!="或者“<>” 不走索引。从下图可以知道原因，因为B树的左节点是比右节点小，而且节点有指针很快能找到范围的数据，B树特性+指针的配合这样可以快速找到指定范围数据。

图：

六、mysql为什么用整型自增作为索引比较好。而UUID作为索引效率比较低？

索引存储在磁盘，而且树的每个节点分配的空间有大小。整型占空间比较小，这样可以存放多个键值。反之然后UUID占空间比较大。
整型比较方便，UUID比较需要先转成ASCII在进行比较

posted @ 2019-07-21 20:58 N神3 阅读(1420) 评论(0) 收藏举报

刷新页面返回顶部

N神3

mysql索引本质

公告