MySQL Explain关键字与索引优化建议

Explain关键字

用到的数据表如下:

DROP TABLE IF EXISTS `actor`;
CREATE TABLE `actor` (
  `id` int(11) NOT NULL,
  `name` varchar(45) DEFAULT NULL,
  `update_time` datetime DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `actor` (`id`, `name`, `update_time`) VALUES (1,'a','2017-12-22 15:27:18'), (2,'b','2017-12-22 15:27:18'), (3,'c','2017-12-22 15:27:18');

DROP TABLE IF EXISTS `film`;
CREATE TABLE `film` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(10) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `film` (`id`, `name`) VALUES (3,'film0'),(1,'film1'),(2,'film2');

DROP TABLE IF EXISTS `film_actor`;
CREATE TABLE `film_actor` (
  `id` int(11) NOT NULL,
  `film_id` int(11) NOT NULL,
  `actor_id` int(11) NOT NULL,
  `remark` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_film_actor_id` (`film_id`,`actor_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

INSERT INTO `film_actor` (`id`, `film_id`, `actor_id`) VALUES (1,1,1),(2,1,2),(3,2,1); 

结构:

加粗字段表示加了索引,下划线表示联合索引

  • actor
    • id
    • name
    • update_time
  • film
    • id
    • name
  • film_actor
    • id
    • film_id
    • actor_id
    • remark

explain有两个变种:

  • explain extended 会在explain基础上额外提供一些查询优化的信息。

    紧随其后加上 show warnings 命令可以得到优化后的查询语句,从而看出优化器优化了什么。

  • explain partitions 如果查询是基于分区表的话,会显示查询将访问的分区

explain中的列

id

表示 select的序列号,有几个select就有几个id。

  • id越大执行顺序就越优先
  • id相同,越靠上面,执行顺序越优先
  • id为NULL最后执行

例子:

select_type

select_type 表示对应行是简单还是复杂的查询

  • simple : 简单查询。查询不包含子查询和union
  • primary : 复杂查询中最外层的 select
  • subquery : 包含在 select 中的子查询(不在from子句中)
  • derived : 包含在 from子句中的子查询,MySQL会将结果存放在一个临时表中,也成为派生表(derived)
  • union : 在 union中的第二个和随后的 select
  • union result : 从union临时表检索结果的 select

table

这一列表示 explain 的一行正在访问哪个表

partitions

*type

这一列表示关联类型或访问类型,即MySQL决定如何查找表中的行,查找数据行记录的大概范围

从最优到最差为: system > const > eq_ref > ref > range > index > ALL

一般来说,得保证查询达到 range 级别,最好达到 ref

NULL :

MySQL能够在优化阶段分解查询语句,在执行阶段用不着在访问表或索引。

例如:在索引列中选取最小值,可以单独查找索引来完成,不需要在执行时访问表。

const, system :

MySQL能对查询的某部分进行优化,并将其转化成一个常量(可以看成 show warnings 的结果)。用于 primary key 或 unique key 的所有类与常数比较时,所以表最多有一个匹配行,读取1次,速度比较快。 system是const的特例,表里只有一条元素时为system

eq_ref :

primary key 或 unique key 索引的所在部分被join连接使用 ,最多只会返回一条符合条件的记录。这可能是在 const 之外最好的联接类型了,简单的 select 查询不会出现这种 type。

ref :

相比 eq_ref,不使用唯一索引,而是使用普通索引或者唯一性索引的部分前缀,索引要和某个值相比较,可能会找到多个符合条件的行

range :

范围扫描通常出现在 *in(), between ,> ,<, >=* 等操作中。使用一个索引来检索给定范围的行。

index :

扫描全表索引,这通常比ALL快一些。(index是从索引中读取的,而all是从硬盘中读取)

ALL :

即全表扫描,意味着mysql需要从头到尾去查找所需要的行。通常情况下这需要增加索引来进行优化了

possible_keys

这一列显示查询可能使用哪些索引来查找。

explain 时可能出现 possible_keys 有列,而 key 显示 NULL 的情况,这种情况是因为表中数据不多,mysql认为索引对此查询帮助不大,选择了全表查询。

如果该列是NULL,则没有相关的索引。在这种情况下,可以通过检查 where 子句看是否可以创造一个适当的索引来提高查询性能,然后用 explain 查看效果。

*key

这一列显示mysql实际采用哪个索引来优化对该表的访问。

如果没有使用索引,则该列是 NULL。如果想强制mysql使用或忽视possible_keys列中的索引,在查询中使用 force index、ignore index。

key_len

这一列显示了mysql在索引里使用的字节数,通过这个值可以算出具体使用了索引中的哪些列。

举例来说,film_actor的联合索引 idx_film_actor_idfilm_idactor_id 两个 int 列组成,并且每个 int 是4字节。通过结果中的 key_len=4 可推断出查询只使用了第一个列film_id 列来执行索引查找。

key_len计算规则如下:

  • l字符串

    • char(n):n字节长度
    • varchar(n):2字节存储字符串长度,如果是utf-8,则长度 3n + 2
  • 数值类型

    • tinyint:1字节
    • smallint:2字节
    • int:4字节
    • bigint:8字节  
  • 时间类型 

    • date:3字节
    • timestamp:4字节
    • datetime:8字节
  • 如果字段允许为 NULL,需要1字节记录是否为 NULL

索引最大长度是768字节,当字符串过长时,MySQL会做一个类似左前缀索引的处理,将前半部分的字符提取出来做索引

ref

这一列显示了在key列记录的索引中,表查找值所用到的列或常量,

常见的有:const(常量),字段名(例:film.id)

*rows

这一列是mysql估计要读取并检测的行数,注意这个不是结果集里的行数

filtered

*Extra

这一列展示的是额外信息。常见的重要值如下:

  • Using index:查询的列被索引覆盖,并且where筛选条件是索引的前导列,是性能高的表现。

    一般是使用了覆盖索引(索引包含了所有查询的字段)。对于innodb来说,如果是辅助索引性能会有不少提高

  • Using where:查询的列未被索引覆盖,where筛选条件非索引的前导列

  • Using where Using index:查询的列被索引覆盖,并且where筛选条件是索引列之一但是不是索引的前导列,意味着无法直接通过索引查找来查询到符合条件的数据

  • NULL:查询的列未被索引覆盖,并且where筛选条件是索引的前导列,意味着用到了索引,但是部分字段未被索引覆盖,必须通过“回表”来实现,不是纯粹地用到了索引,也不是完全没用到索引

  • Using index condition:与Using where类似,查询的列不完全被索引覆盖,where条件中是一个前导列的范围

  • Using temporary: MySQL需要创建一张临时表来处理查询。出现这种情况一般是要进行优化的,首先是想到用索引来优化。

  • Using filesort: MySQL 会对结果使用一个外部索引排序,而不是按索引次序从表里读取行。此时MySQL会根据联接类型浏览所有符合条件的记录,并保存排序关键字和行指针,然后排序关键字并按顺序检索行信息。这种情况下一般也是要考虑使用索引来优化的。

索引最佳实践

  • 全值匹配

  • 最佳左前缀法则

  • 不在索引列上做任何操作(计算,函数,类型装换(自动或手动)),会导致索引失效而转向全表扫描

  • 存储引擎不能使用索引中范围条件右边的列

  • 尽量使用覆盖索引看(只访问索引的查询(索引列包含查询列)),尽量不使用 select * 语句

  • MySQL 在使用 不等于(!= 或者 <>)的时候无法使用索引,会导致全表扫描

  • is null, is not null 也无法使用索引

  • like 以通配符开头('$abc...')MySQL索引失效会变成全表扫描操作

    问题:解决like'%字符串%'索引不被使用的方法?

    a)使用覆盖索引,查询字段必须是建立覆盖索引字段

    EXPLAIN SELECT name,age,position FROM employees WHERE name like '%Lei%';

    b)当覆盖索引指向的字段是varchar(380)及380以上的字段时,覆盖索引会失效!

  • 字符串不加单引号索引失效

    不加单引号 MySQL会自动进行转换,相当于在索引列上做了计算或函数操作,导致索引失效

  • 少用 or 和 in,用 or或 in很多情况下索引会失效

posted @ 2020-08-12 15:14  它山之玉  阅读(485)  评论(0编辑  收藏  举报