MySQL索引

主键索引和普通索引结构上的区别

每一个索引在InnoDB里面对应一棵B+树。
有一个主键列为ID的表，表中有字段k，在k上有索引。
CREATE TABLE T (
id int PRIMARY KEY,
k int NOT NULL,
name varchar(16),
INDEX(k)
) ENGINE = InnoDB;
表中R1~R5的(ID,k)值分别为(100,1)、(200,2)、(300,3)、(500,5)和(600,6)。

InnoDB中主键索引也称为聚簇索引，主键索引的叶子节点存的是整行数据。

InnoDB中非主键索引也称为二级索引，非主键索引的叶子节点内容是主键的值。

如果非主键索引无法涵盖查询字段，那么就需要通过主键回表查询主键索引。索引可以覆盖查询字段时称为覆盖索引。

自增主键优势

NOT NULL PRIMARY KEY AUTO_INCREMENT
插入新记录时，系统会获取当前ID最大值加1作为新记录的ID值。
从性能角度来说，插入新记录不涉及其他记录的移动，不触发叶子节点的分裂。
从存储角度来说，主键长度越小，普通索引的叶子节点就越小。

为什么MySQL使用B+树？

树的高度会影响磁盘IO次数。
为什么不用二叉搜索树？
如果数据是顺序的，那么二叉树会变成链表样式，查找速度慢。
为什么不用红黑树？
红黑树一个节点只能存储一个数据，存储大量数据场景，红黑树高度大，查找速度慢。
为什么不用B树？
B+树在查找数据方面比B树更方便。
1. B+树的非叶子节点存储索引值，不存储数据行，叶子节点存储数据行。B树节点存储数据行，B+树比B树高度低。
2. 在范围查找时，B+树叶子节点采用双向链表，比B树快。

前缀索引

B+树可以利用索引的最左前缀来定位记录。
联合索引（name，age）

索引项是按照索引定义里面出现的字段顺序排序的。
当查询名字是张三的人时，快速定位到ID4，向后遍历得到结果。
当查询名字第一个字是张的人即where name like ‘张%’，快速定位到ID3，然后向后遍历，直到不满足条件为止。
最左前缀可以是联合索引的最左N个字段，也可以是字符串索引的最左M个字符。
使用联合索引时，考虑索引数量和成本。

索引下推

以市民表的联合索引（name, age）为例，检索出表中名字第一个字是张且年龄是10岁的所有男孩的SQL是
select * from tuser where name like '张%' and age=10 and ismale=1;
根据最左前缀原则，只能用 “张”，找到第一个满足条件的记录ID3，比全表扫描好。
MySQL 5.6之前，只能从ID3开始一个个回表，到主键索引上找出数据行，再对比字段值。MySQL 5.6引入的索引下推优化，在索引遍历过程中，对非主键索引中包含的字段先做判断，直接过滤掉不满足条件的记录，减少回表次数。

每一个虚线箭头表示回表一次。
无索引下推执行流程（回表4次）

索引下推执行流程（回表2次）

索引失效的情况

以%开头的like语句执行前导模糊匹配
select * from order where name like '%XX'

or语句前后没有同时使用索引
数据类型出现隐式强制转换
例如，varchar值不加单引号时可能会自动转换成int
select * from user where phone=13800001234
强制类型转换会导致全表扫描

负向条件查询
select * from order where status != 0 and stauts != 1

字段上执行函数计算
select * from order where YEAR(date) < = '2017'

可优化为值计算
select * from order where date < = CURDATE()
或者
select * from order where date < = '2017-01-01'

违反最左前缀匹配
idx_age_name(age, name)
select * from user where name = ‘王五’

范围查询时右侧的列不能使用索引
idx name_age_phoneNumber(name, age, phone_number)
where name = ‘王五’and age > 17 and phone_number = ‘13888888888’

查询行数

COUNT(*)和COUNT(1)没有区别，统计所有，性能差不多，推荐使用COUNT(*)；COUNT(列名)不统计该列是NULL的。

在MySQL 5.7.18之前，通过扫描主键来处理COUNT(*)。
在MySQL 5.7.18后，通过扫描最小的二级索引来处理COUNT(*)。如果不存在二级索引，那么扫描聚簇索引。二级索引比主键索引小。

索引对insert、update和delete的影响

insert

不会用到索引，维护索引会耗时。

update

使用基于区分度较高的字段加的索引，更新更快。
使用基于区分度较低的字段加的索引，更新其他字段时有无索引区别不大，更新这个字段时更新更慢。

delete

删除的条件上用到索引更新更快。

参考资料

MySQL 实战 45 讲

posted on 2023-07-16 14:05 王景迁阅读(49) 评论(0) 收藏举报

刷新页面返回顶部