说一下Mysql索引

什么是索引

帮助数据库高效获取数据的数据结构

当表中数据量越来越大时，索引可以明显提高查询效率，当然索引并不是越多越好

MySql中索引默认结构为B+树，为什么不是B树、Hash,二叉树，红黑树？

B+树底层实现是多路平衡查找树，对于每一次的查询都是从根节点出发，查找到叶子节点方可获得所查键值，然后根据查询判断是否需要回表查询数据。B+树的查询效率比较稳定，对于所有的查询都是从根节点到叶子节点，且树的高度较低。

非叶子节点的查找用的二分查找。

因为其不管是叶子节点还是非叶子节点都会保存数据，这样导致在非叶子节点中能保存的指针数量变少，指针少的情况下要保存大量的数据，只能增加树的高度，导致IO操作变多，查询性能变低

Hash索引底层就是hash表，进行查找时，调用一次hash函数就可以获取到相应的键值，之后进行回表查询获得实际数据。

Hash索引虽然在等值查询上比较快，但不稳定，性能不可预测，当某个键值存在大量重复的时候，发生hash碰撞，此时效率可能极差。

树的高度不均匀，不能自平衡，查找和树的高度有关，并且IO代价高

树的高度随着数据量的增加而增加，IO代价高

MySQL使用B+Tree作为索引数据结构。

B+Tree在新增数据时，会根据索引指定列的值对旧的B+Tree做调整。从物理存储结构上说，B-Tree 和B+Tree都以页(4K)来划分节点的大小，但是由于B+Tree中中间节点不存储数据，因此B+Tree能够在同样大小的节点中，存储更多的key,提高查找效率。

影响MySQL查找性能的主要还是磁盘I0次数，大部分是磁头移动到指定磁道的时间花费。

MyISAM存储引擎下索引和数据存储是分离的，InnoDB 索引和数据存储在一起。

InnoDB 存储引擎下索引的实现，(辅助索引)全部是依赖于主索引建立的(辅助索引中叶子结点存储的并不是数据的地址，还是主索引的值，因此，所有依赖于辅助索引的都是先根据辅助索引查到主索引，再根据主索引查数据的地址)。

由于InnoDB索引的特性，因此如果主索引不是自增的(id作主键)，那么每次插入新的数据，都很可能对B+Tree的主索引进行重整，影响性能。因此，尽量以自增id作为InnoDB的主索引。

posted @ 2021-10-10 16:16 明叶师兄。阅读(149) 评论(0) 收藏举报

刷新页面返回顶部