MySql优化- 执行计划解读与优化(二)
待阅
https://mp.weixin.qq.com/s/IN2mzyOXdVWE0NQJr1egcA
说明
解读执行计划l对于我们日常工作中慢sql的分析和调优有很大帮助,同时在解读的过程中也能知道如何规避慢sql
建议需要了解join匹配原理的知识:https://www.cnblogs.com/LQBlog/p/10711743.html
查看sql优化器优化后的sql
EXPLAIN EXTENDED select * from( select * from( select cn.`id` from `cpn_coupon` cn where cn.`create_timestamp` >='2019-12-27'))tab2 SHOW WARNINGS
mysql执行计划表结构
各个字段详解
测试表结构说明
sl_sales_bill_copy1 订单抬头表
sl_sales_bill_copy1订单行项目表
order_status 订单状态变动表
id
执行顺序 值越大的优先执行 如果相同则根据从上到下的顺序来确定 如果为null则最后执行
#查出订单状态存在1010的订单的所有行项目信息
EXPLAIN select * from sl_sales_bill_copy1 lb join sl_sales_bill_head_copy1 lh on lh.SALES_BILL_NO = lb.SALES_BILL_NO where lb.SALES_BILL_NO in(select ls.SALES_BILL_NO from order_status ls where ls.status_code=1010)
先执行id为2查询 将查询结果保存为临时表,再执行id为1的 从上到下,先将lb为驱动表关联查询lh得出结果 subquery2临时表 然后作为临时表去非驱动表ls查询数据
select_type
用途:查询的类型,主要是用于区分普通查询、联合查询、子查询等复杂的查询
1、SIMPLE:简单的select查询,查询中不包含子查询或者union 2、PRIMARY:查询中包含任何复杂的子部分,最外层查询则被标记为primary 3、SUBQUERY:被驱动的SELECT子查询(子查询位于FROM子句 where)
4、DEPENDENT SUBQUERY 子查询依赖外部查询,慎用 5、DERIVED:在from列表中包含的子查询被标记为derived(衍生),mysql或递归执行这些子查询,把结果放在临时表里
6、MATERIALIZED 物化子查询,子查询来自视图 7、UNION:在UNION
查询语句中的第二个和紧随其后的SELECT
。 8、UNION RESULT:组中union结果的临时表 9、DEPENDENT SUBQUERY 子查询依赖外部查询(慎用)
10、DEPENDENT UNION 子查询中包含union
SIMPLE
explain select * from cpn_coupon where id=1
SUBQUERY
先通过子查询得出id 再根据id值去查询
EXPLAIN select * from cpn_coupon c where c.id =(select max(cn.coupon_id) from `cpn_coupon_code` cn where cn.`create_timestamp` >='2019-12-27')
DEPENDENT SUBQUERY
慎用子查询依赖外部查询,会先根据外部查询得出一个临时表 再根据临时表 去触发子查询 因为p表没有查询条件 每条数据都会触发一次o表查询 现在数据 566条 相当于触发了566 t2 select 数据量大就更夸张(就算t2走了索引页会导致性能问题) 建议改成select join group by 可以理解为p表查询结果为临时表。在for循环遍历每一条数据 查询o表
可以理解为
var items=select * from prm_page_promotion for(var item in items){ select * from prm_page_promotion o where o.parent_id=item.getId(); }
explain select * from prm_page_promotion p where exists(select p.id from prm_page_promotion o where p.id=o.parent_id)
DERIVED
子查询位于form处 先通过create_timestamp查询结果到临时表 再根据临时表id查询
EXPLAIN select * from( select cn.`id` from `cpn_coupon` cn where cn.`create_timestamp` >='2019-12-27')tab2 where tab2.id=1
MATERIALIZED
--创建视图 create view v1 as select cn.coupon_id from `cpn_coupon_code` cn where cn.`create_timestamp` >='2019-12-27' --使用视图为子查询 EXPLAIN select * from cpn_coupon c where c.id in(select v1.coupon_id from v1)
UNION/UNOIN_RESULT
cp2为union表 可以看出是先执行cpu2再执行cp2 primary为最外层,然后汇聚成UNION RESULT 结果
explain select * from cpn_coupon where id=578032073359495168 union all select * from cpn_coupon where id=580952931153494016
DEPENDENT UNION
explain select * from cpn_coupon cp where cp.id in(select cp1.id from cpn_coupon cp1 where cp1.id=578032073359495168 union all select cp2.id from cpn_coupon cp2 where cp2.id=580952931153494016)
cp2 cp1 查询结果为unioReuslt再通过cp表子查询union结果集
table
table
列表示 EXPLAIN
的单独行的唯一标识符。这个值可能是表名、表的别名或者一个未查询产生临时表的标识符,如派生表、子查询或集合。
当 FROM
子句中有子查询时,如果优化器采用的物化方式,table 列是 <derivenN>
格式,表示当前查询依赖 id=N
的查询,于是先执行 id=N
的查询。
当使用 UNION
查询时,UNION RESULT
的 table 列的值为 <UNION1,2>
,1和2表示参与 UNION
的 SELECT 的行 id。
具体可参考 上面:select_type unino和 DERIVED的执行计划
type
这一列表示关联类型或访问类型,即MySQL决定如何查找表中的行,查找数据行记录的大概范围。依次从最优到最差分别为:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
一般来说,好的sql查询至少达到range级别,最好能达到ref
system
const的特例平时无法重现 可以忽略
const
表示通过扫描索引 扫描一行就找到了数据 const用于比较primary key 或者 unique索引。因为只需匹配一行数据,所有很快。如果将主键置于where列表中,mysql就能将该查询转换为一个const
eq_ref
表连接时 被驱动表关联字段查询为主键或者唯一索引查找时
lb.id为主键索引
如果where条件中查询非驱动表为非唯一索引或者主键索引则会降为ref
ref
被驱动表关联字段查询为非唯一索索引和主键索引的普通索引时
lh.SALES_BILL_NO为普通索引
range
表示范围查询 常见于between 和>, >=,<, <= 前提是字段有建立btree索引
count未建立索引执行计划
count建立索引后
index
与ALL类似 只是index全表扫描扫描的是索引页而不是数据行
因为我们id做了索引 所以只需要去索引页里面取出所有id数据就好了
ALL
全表扫描
index_merge
index_merge其实就是分别通过对两个独立的index进行过滤之后,将过滤之后的结果聚合在一起,然后在返回结果集
1.为什么会有index merge
我们的 where 中可能有多个条件(或者join)涉及到多个字段,它们之间进行 AND 或者 OR,那么此时就有可能会使用到 index merge 技术。index merge 技术如果简单的说,其实就是:对多个索引分别进行条件扫描,然后将它们各自的结果进行合并(intersect/union)。
MySQL5.0之前,一个表一次只能使用一个索引,无法同时使用多个索引分别进行条件扫描。但是从5.1开始,引入了 index merge 优化技术,对同一个表可以使用多个索引分别进行条件扫描。
2.对 index merge 的进一步优化
index merge使得我们可以使用到多个索引同时进行扫描,然后将结果进行合并。听起来好像是很好的功能,但是如果出现了 index intersect merge,那么一般同时也意味着我们的索引建立得不太合理,因为 index intersect merge 是可以通过建立 复合索引进行更一步优化的。
————————————————
版权声明:本文为CSDN博主「lazzZa」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_33095135/article/details/122188017
possible_keys
指出MySQL可能使用哪个索引在表中找到行,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询使用
key
实际使用的索引,如果为NULL,则没有使用索引,如果出现possible_keys有值但是 key为null 可能是在数据少量情况下 mysql优化器认为全表扫描比走索引快,所以放弃使用索引
如果想强制 MySQL使用或忽视 possible_keys
列中的索引,在查询中使用 force index
、ignore index
。
key_len
表示索引中使用的字节数,查询中使用的索引的长度(最大可能长度),并非实际使用长度,理论上长度越短越好。key_len是根据表定义计算而得的,不是通过表内检索出的
1.字符串类型key_length计算规则
各个字符集长度 utf8mb4=4,utf8=3,gbk=2,latin1=1
key_len=(表字符集长度) * 列长度 + 1(null) + 2(变长列)
char(n):n字节长度
varchar(n):2字节存储字符串长度,如果是utf-8,则长度 3n + 2
注意:该索引列可以存储NULL
值,则key_len
比不可以存储NULL
值时多1个字节。
比如:varchar(50),字符集为utf8 则实际占用的key_len
长度是 3 * 50 + 2 = 152,如果该列允许存储NULL
,则key_len
长度是153。
2.数值类型key_length计算规则
tinyint:1字节 smallint:2字节 int:4字节 bigint:8字节
3.时间类型
date:3字节 timestamp:4字节 datetime:8字节
索引最大长度是768字节,当字符串过长时,MySQL 会做一个类似左前缀索引的处理,将前半部分的字符提取出来做索引。
举例1:
id为主键索引 为bigint 索引key_length=8
explain select cp1.id from cpn_coupon cp1 where cp1.id=578032073359495168
举例2:
coupon_name为varchar(64) 按照计算公式key_len=(表字符集长度) * 列长度 + 1(null) + 2(变长列) 4*64+1+2=259
explain select cp1.id from cpn_coupon cp1 where cp1.coupon_name='a'
ref
ref
列显示了在 key
列记录的索引中,表查找值所用到的列或常量,常见的有:const
(常量),字段名
(例:user.id
)
rows
列是查询优化器估计要读取并检测的行数,注意这个不是结果集里的行数。
如果查询优化器使用全表扫描查询,rows
列代表预计的需要扫码的行数;如果查询优化器使用索引执行查询,rows
列代表预计扫描的索引记录行数。
Extra
Extra
列提供了一些额外信息。这一列在 MySQL中提供的信息有几十个,这里仅列举一些常见的重要值如下:
Using index
表示使用了覆盖索引,覆盖索引:表示索引包含了返回所有列 而不回表
Using where Using index
查询的列被索引覆盖,并且 WHERE
筛选条件是索引列之一 id为主键 name为普通索引
explain select cp1.id from cpn_coupon cp1 where cp1.coupon_name='a'
NULL
查询的列未被索引覆盖,并且 WHERE
筛选条件是索引的前导列,意味着用到了索引,但是部分字段未被索引覆盖,必须通过 回表
来查询,不是纯粹地用到了索引,也不是完全没用到索引。
id主键 introduction没有索引,需要根据回表获取到对应数据
explain select cp1.id,cp1.introduction from cpn_coupon cp1
Using where
Using where的作用只是提醒我们MySQL将用where子句来过滤结果集
Using index condition
查询的列不完全被索引覆盖 where条件为二级索引 需要根据二级索引存储的聚簇索引id 获得数据才能拿到introduction(回表)
id为主键 introduction没有索引 coupon_name有索引
explain select cp1.id,cp1.introduction from cpn_coupon cp1 where cp1.coupon_name='a'
Using temporary
表示mysql需要临时表转存数据 常见于 group by、DISTINCT、ORDER BY使用非索引字段 一般出现这种情况就需要考虑进行优化了,首先是想到用索引来优化。
表示使用了非索引字段排序
Using filesort
如果一个排序操作不能通过索引来完成,那这次排序操作就叫做filesort,这跟file没有任何关系。filesort应该叫做sort,而它的实现,就是大家熟悉的快排(一般由于 排序列没有建索引导致)
有时候存在Using filesort,也未必是什么大不了的:如
select * from t_talbe order by id;只是告诉你它使用了“all rows”。
什么是回表查询如何避免回表
首先看聚簇索引和非聚簇索引构成点击跳转
例子1:
id为聚簇索引 name为非聚簇索引 通过聚簇索引name查找可以找到id 无须回表查询效率高
select id,name from user where name='shenjian';
Extra:Using index。
例子2
id为聚簇索引 name为非聚簇索引,sex为非索引,sex需要根据聚簇索引获取到对应的数据行(回表操作) 如果将name和sex升级为联合索引则无须回表
select id,name,sex from user where name='shenjian';
Extra:Using index condition。
不要使用cont(*) 避免回表 使用 coun(索引列)
如何查找mysql中的慢sql
1.查看mysql是否开启mansql记录日志
show variables like 'slow_query_log';
2.慢sql记录时间
show variables like 'long_query_time';
3.设置记录mysql为打开状态
set global slow_query_log='ON';OFF为关闭
设置超过一秒的sql都将记录
set global long_query_time=1
设置记录文件
set global slow_query_log_file='/var/lib/mysql/test_1116.log';
查看记录文件
show variables like 'slow_query_log_file';
优化实践
数据表
# 重建 `staff` 表 DROP TABLE `staff`; CREATE TABLE `staff` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名', `s_name` VARCHAR(24) NOT NULL DEFAULT '' COMMENT '花名', `s_no` INT(4) NOT NULL DEFAULT 0 COMMENT '工号', `work_age` int(11) NOT NULL DEFAULT '0' COMMENT '工龄', `position` varchar(20) NOT NULL DEFAULT '' COMMENT '职位', `arrival_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入职时间', `remark` VARCHAR(500) DEFAULT NULL COMMENT '备注', # 允许 NULL PRIMARY KEY (`id`), # 主键 UNIQUE KEY idx_s_name (s_name), # 唯一索引 KEY idx_s_no (s_no), # 普通索引 KEY `idx_name_age_position` (`name`,`work_age`,`position`) USING BTREE # 联合索引 ) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='员工记录表'; # 初始化 `staff` 表数据 INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('zhangsan','zs',10,2,'manager',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('lisi','ls',11,3,'dev',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('wangwu','ww',12,8,'dev',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('zhangliu','zl',110,5,'dev',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('xiaosun','xs',111,5,'dev',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('donggua','dg',200,3,'dev',NOW());
全值匹配
EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan';
EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan' AND work_age = 2;
EXPLAIN SELECT * FROM staff where name = 'zhangsan' AND work_age = 2 AND position = 'dev';
EXPLAIN SELECT * FROM staff where position = 'dev' AND name = 'zhangsan' AND work_age = 2;
这里我们将联合索引最左name排在后面 也能正常使用索引时因为mysql优化后会帮我们排在前面,在写的过程中 还是要根据联合索引顺序编写,避免二次优化
最佳左前缀法则
如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。
跳过了name(全表扫描)
EXPLAIN SELECT * FROM staff WHERE work_age = 2 AND position ='dev';
跳过了name和work_age(全表扫描)
EXPLAIN SELECT * FROM staff WHERE position = 'dev';
索引列上避免做计算操作
EXPLAIN SELECT * FROM staff WHERE LEFT(name, 5) = 'zhang';
EXPLAIN SELECT * FROM staff WHERE LOWER(name) = 'zhangsan';
查询值上函数运算是没问题的
EXPLAIN SELECT * FROM staff WHERE name = LEFT('zhang',5);
其实很好理解比如你通过hashMap存储根据name快速找到对应对象,如果你要根据key做处理匹配 就只能遍历keys 做完处理再比较
但是如果你正式查询条件使用函数,你只是在get之前 通过函数转了一下查询值 不会影响索引
范围条件右边的列无法使用索引
EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan' AND work_age > 2 AND position ='dev';
根据上面key_length计算规则 idx_name+age的索引长度 正好为78 索引position没有用到索引
只是从 name = 'zhangsan' AND work_age > 2
条件返回的结果集中,再过滤符合 position 字段条件的数据。
尽量使用覆盖索引
1覆盖索引:简单理解,只访问建了索引的列。减少使用 SELECT *
语句查询列。 避免回表
未回表查询
EXPLAIN SELECT name,work_age FROM staff WHERE name= 'zhangsan' AND work_age = 3;
回表查询
因为查询 返回了非索引字段 所以需要根据聚簇索引找到对应的数据行
EXPLAIN SELECT name,work_age,s_no FROM staff WHERE name= 'zhangsan' AND work_age = 3; EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan' AND work_age = 3;
范围条件查找能够命中索引
例子1:
若条件中范围列有普通索引和主键索引同时存在, 优先使用主键索引:
EXPLAIN SELECT * FROM staff WHERE staff.s_no > 10 AND staff.id > 2;
例子2:
EXPLAIN SELECT * FROM staff WHERE staff.name != 'zl' AND staff.s_no > 1 ;
可以看到s_no没有走 索引 因为数据量比较小,sql优化引擎认为全表扫描比索引快,因为会回表 需要查询2次
我们可以改为force index强制走索引
EXPLAIN SELECT * FROM staff force index(idx_s_no) WHERE staff.name != 'zl' AND staff.s_no > 1 ;
IS NOT NULL 无法使用索引
EXPLAIN select * from cpn_coupon c where c.coupon_name is null
EXPLAIN select * from cpn_coupon c where c.coupon_name is not null
模糊条件查询以通配符开头索引失效
EXPLAIN SELECT * from staff where name like '%zhang%';
EXPLAIN SELECT * from staff where name like '%zhang';
EXPLAIN SELECT * from staff where name like 'zhang%';
改为覆盖索引将走索引
EXPLAIN SELECT name,work_age FROM staff WHERE name LIKE '%zhang%';
避免隐式转换
未加单引号
EXPLAIN SELECT * FROM staff WHERE name = 1;
可以理解为
EXPLAIN SELECT * FROM staff WHERE CONVERT(name,int) = 1;
OR多数情况会失效
因为是or查询,所以格努work_age找索引 没有满足最左前缀匹配将全表扫描
EXPLAIN SELECT * FROM staff WHERE name='zhangsan' OR work_age = 2;
优化为将走索引
EXPLAIN SELECT * FROM staff WHERE name='zhangsan' OR (name='zhangsan' and work_age = 2);
使用覆盖查询将走索引
explain SELECT name,work_age FROM staff WHERE name='zhangsan' OR work_age = 2;
EXPLAIN SELECT * FROM staff WHERE name='zhangsan' OR s_name='wangwu';
使用union改进
EXPLAIN SELECT * FROM staff WHERE name='zhangsan' union all SELECT * FROM staff WHERE s_name='wangwu';
id2 后面extra是因为 唯一索引如果查询不存在的值将不会走索引 参考:https://www.cnblogs.com/huahua035/p/10573930.html
注意所以再日常使用中不要使用 先查询判断是否存在 再插入 直接插入 让mysql抛出异常 并捕获异常比如用户注册,但是建立了唯一索引查询的时候就要特别注意 查询的地方
负向查询条件不能使用索引
负向查询条件包括:!=、<>、NOT IN、NOT EXISTS、NOT LIKE
等。
EXPLAIN SELECT * FROM staff WHERE id !=1 AND id != 2; EXPLAIN SELECT * FROM staff WHERE id NOT IN (1,2);
in则可以命中
EXPLAIN SELECT * FROM staff WHERE id IN (11,12);
排序对索引的影响
ORDER BY
是经常用的语句,排序也遵循最左前缀列的原则。
EXPLAIN SELECT * FROM staff ORDER BY name,work_age;
EXPLAIN SELECT name,work_age FROM staff ORDER BY name,work_age;
覆盖索引可以命中索引
索引优化总结
1.更新非常频繁字段不宜建索引
因为字段更新台频繁,会导致B+树的频繁的变更,重建索引。所以这个过程是十分消耗数据库性能的。
2.区分度不大的字段不宜建索引
比如类似性别这类的字段,区分度不大,建立索引的意义不大。因为不能有效过滤数据,性能和全表扫描相当。另外注意一点,返回数据的比例在 30%
之外的,优化器不会选择使用索引。
3.业务中有唯一特性的字段,建议建成唯一索引
业务中如果有唯一特性的字段,即使是多个字段的组合,也尽量都建成唯一索引。尽管唯一索引会影响插入效率,但是对于查询的速度提升是非常明显的。此外,还能够提供校验机制,如果没有唯一索引,高并发场景下,可能还会产生脏数据。
但是要小心 查询不存在的数据不走索引
4.多表关联时,要确保关联字段上非驱动表必须有索引
5.避免字符集不一致导致的索引无效参考:https://www.cnblogs.com/LQBlog/p/16807067.html#autoid-0-0-0