知识笔记---sql高级4.索引失效及查询优化

1. 索引失效

(1)全值匹配的情况
(2)最佳左前缀法则:如果索引了多列，要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列
(3)不在索引列上做任何操作(计算、函数、类型转换)，会导致索引失效而转向全表扫描
(4)存储引擎不能使用索引中范围条件右边的列
(5)尽量使用覆盖索引，减少select *
(6)mysql在使用!=的时候无法使用索引会导致全表扫描
(7)is not null也无法使用索引，但是is null是可以使用索引的
(8)like以通配符开头时，mysql索引失效会变成全表扫描
(9)字符串不加单引号索引失效
(10)少用or,用它来连接时索引会失效
(11)where子句中如果出现索引的范围查询会导致order by索引失效

补充

回表

select * from table where name = zhansan;
第一次查询name的B+树,根据name获取到主键id，然后根据id去id的B+树找到记录，这个回表过程会导致IO次数变多。

覆盖索引

select id, name from table where name = zhansan;
在进行检索时，直接根据name去name的B+树获取到id,name两列的值，不需要回表，效率高，应该尽可能多的使用索引覆盖来替代回表，所以有时候，在复杂的sql中，可以考虑将不相关的列都设置为索引列。

最左匹配

有一个表：id，name，age，gender（id是主键，name，age是联合索引）
select * from table where name=?           # 符合
select * from table where name=? and age=? # 符合
select * from table where age=? = name=?   # 优化器会优化,使其符合最左匹配
select * from table where age=?            # 不符合

索引下推

select * from table where name=? and age=?
在没有索引下推之前，先根据name去存储引擎中拉取符合结构的数据，返回到server层，在server层中对age的条件进行过滤
有了索引下推之后，根据name，age两个条件直接从存储引擎中拉去结果，不需要再server层做条件过滤
mysql5.7版本之后默认开启

2. 查询优化

1.小表驱动大表

当A表的数据集小于B表的数据集的时候，用in优于exists
select * from A where id in (select id from B)
等价于
select id from B
select * from A where A.id = B.id


当B表的数据集小于A表的数据集的时候，用exists优于in
select * from A where exists (select 1 from B where B.id = A.id)
等价于
select * from A
select * from B where B.id = A.id

2.order by关键字优化

MySQL支持二种方式的排序，FileSort和Index。
Index效率高，指MySQL扫描索引本身完成排序。FileSort方式效率较低。
尽可能在索引列上完成排序操作，遵照索引键的最佳做前缀
ORDER BY满足两情况，会使用Index方式排序
ORDER BY 语句使用索引最左前列
使用Where子句与Order BY子句条件列组合满足索引最左前列

设a,b,c为索引

order by能使用索引最左前缀
-ORDER BY a
-ORDER BY a, b
-ORDER BY a, b, c
-ORDER BY a desc, b desc, c desc

如果WHERE使用索引的最左前缀定义为常量，则order by能使用索引
where a = const order by b,c
where a = const and b = const order by c
where a = const and b > const order by b,c

不能使用索引进行排序
order by a asc, b desc, c desc -- 排序不一致
where g = const order by b, c  -- 丢失a索引
where a = const order by c     -- 丢失b索引
where a = const order by a, d  -- d不是索引的一部分
where a in (...) order by b, c -- 对于排序来说，多个相等条件也是范围查询

如果不在索引列上，filesort有两种算法

1.双路排序(又叫回表排序模式)

先根据相应的条件取出相应的排序字段和可以直接定位行数据的行ID，然后在sort buffer中进行排序，排序完后需要再次取回其它需要的字段

举个例子，下面有一段sql：
select * from user where name="自由的辣条" order by age

1.从索引 name 找到第一个满足 name = ‘自由的辣条’ 的主键id
2.根据主键 id 取出整行，把排序字段 age 和主键 id 这两个字段放到 sort buffer(排序缓存) 中
3.从索引 name 取下一个满足 name = ‘自由的辣条’ 记录的主键 id
4.重复 2、3 直到不满足 name = ‘自由的辣条’
5.对sort_buffer中的字段 age 和主键 id 按照字段 age进行排序
6.遍历排序好的 id 和字段 age ，按照 id 的值回到原表中取出 所有字段的值返回给客户端

2.单路排序

是一次性取出满足条件行的所有字段，然后在sort buffer中进行排序

举个例子，下面有一段sql：
select * from user where name="自由的辣条" order by age

1.从索引name找到第一个满足 name = ‘自由的辣条’ 条件的主键 id
2.根据主键 id 取出整行，取出所有字段的值，存入 sort_buffer(排序缓存)中
3.从索引name找到下一个满足 name = ‘自由的辣条’ 条件的主键 id
4.重复步骤 2、3 直到不满足 name = ‘自由的辣条’
5.对 sort_buffer 中的数据按照字段 age 进行排序
6.返回结果给客户端

问题：在sort_buffer中，单路排序比双路排序要多占用很多空间，因为单路排序是把所有字段都取出, 所以有可能取出的数据的总大小超出了sort_buffer的容量，导致每次只能取sort_buffer容量大小的数据，进行排序（创建tmp文件，多路合并），排完再取取sort_buffer容量大小，再排……从而多次I/O。本来想省一次I/O操作，反而导致了大量的I/O操作，反而得不偿失。

优化策略

增大sort_buffer_size参数的设置
增大max_length_for_sort_data参数的设置

3.group by关键字优化

group by实质是先排序后进行分组，遵照索引建的最佳左前缀
当无法使用索引列，增大max_length_for_sort_data参数的设置+增大sort_buffer_size参数的设置
where高于having，能写在where限定的条件就不要去having限定了。

4.关联查询优化

1.保证被驱动表的join字段已经被索引
2.left join 时，选择小表作为驱动表，大表作为被驱动表
3.inner join 时，mysql会自己帮你把小结果集的表选为驱动表
4.子查询尽量不要放在被驱动表，有可能使用不到索引

5.子查询的优化

1.有索引的情况下,用inner join是最好的,其次是in，exists最糟糕
2.无索引的情况下用小表驱动大表,因为join方式需要distinct,没有索引distinct消耗性能较大,所以exists性能最佳,in其次,join性能最差;
3.无索引的情况下,大表驱动小表in 和 exists 的性能应该是接近的,都比较糟糕;
exists稍微好一点, 超不过5%; 但是inner join由于使用了join buffer所以快很多; 如果left join,则最慢;

6.分页查询优化

# 优化前
EXPLAIN SELECT SQL_NO_CACHE * FROM emp 
ORDER BY deptno LIMIT 10000,40

# 优化后
EXPLAIN SELECT SQL_NO_CACHE * FROM emp 
INNER JOIN 
(SELECT id 
FROM emp e 
ORDER BY deptno 
LIMIT 10000,40) a 
ON a.id=emp.id

先利用覆盖索引把要取的数据行的主键取到，然后再用这个主键列与数据表做关联（查询的数据量小了）
实践证明：
①order by 后的字段（XXX）有索引
②sql 中有 limit 时，当 select id 或 XXX字段索引包含字段时，显示 using index 当 select 后的字段含有 bouder by 字段索引不包含的字段时，将显示 using filesort

7.去重优化

尽量不要使用distinct关键字去重
group by能去重且利用索引

3.关于联合查询补充

posted @ 2022-04-01 20:16 jsqup 阅读(134) 评论(0) 收藏举报

刷新页面返回顶部

jsqup