MySQL高级--Explain详解
- MySQL Query Oprtimizer(MySQL自带的查询优化器):
-
Mysq|中有专门负责优化SELECT语句的优化器模块,主要功能:通过计算分析系统中收集到的统计信息, 为
客户端请求的Query提供他认为最优的执行计划(他认为最优的数据检索方式,但不见得是DBA认为是最优的,
这部分最耗费时间) -
当客户端向MySQL请求一条Query, 命令解析器模块完成请求分类,区别出是SELECT并转发给MySQL
Query Optimizer时,MySQL Query Optimizer首先会对整条Query进行优化,处理掉一些常量表达式的预算,
直接换算成常量值。并对Query中的查询条件进行简化和转换,如去掉一些无用或显而易见的条件、结构调整
等。然后分析Query中的Hint信息(如果有),看显示Hint信息是否可以完全确定该Query的执行计划。如果
没有Hint或Hint信息还不足以完全确定执行计划,则会读取所涉及对象的统计信息,根据Query进行写相应的
计算分析,然后再得出最后的执行计划。
-
- MySQL常见的瓶颈
-
CPU:CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据时候
-
I0:磁盘I/O瓶颈发生在装入数据远大于内存容量的时候
-
服务器硬件的性能瓶颈:top,free,iostat和vmstat来查看系统的性能状态.
-
-
Explain
- 是什么(查看执行计划):
- 使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何让处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈
- 怎么使用
- explain + SQL语句
- 执行顺序
- id相同,执行顺序由上到下
- id不同,如果是子查询,id的序号会递增,id值越大优先级又高,越先被执行
- id相同不同,同时存在
- 能做些什么呢
- 表的读取顺序
- 数据读取操作的操作类型
- 那些索引可以使用
- 那些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
- 使用EXPLAIN执行结果个字段的解释
- 结果如下
- id字段:
- select查询语句的执行序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
- 三种情况:
- id相同,执行顺序由上到下
- id不同,如果是子查询,id的序号会递增,id值越大优先级又高,越先被执行
- id相同不同,同时存在
- id相同,执行顺序由上到下
- select_type字段:
-
查询类型,主要用于区别普通查询,联合查询,子查询等复杂查询
-
SIMPLE:简单的select查询,查询中不包含组查询或者union
-
PRIMARY:查询中若包含任何复杂的子部分,最外层查询被标记为
-
SUBQUERY:在select或where列表中包含了子查询
-
DERIVED:在from列表中包含的子查询被标记为DERIVED(衍生),mysql会递归执行这些子查询,把结果放在临时表中
-
UNION:若第二个select出现在union之后,则被标记为UNION; 若union包含在from子句的子查询中,则外层的select被标记为:DERIVED
-
UNION RESULT:从UNION表中获取结果的select
-
-
-
table字段
-
显示这一行的数据是关于那张表的
-
-
type字段:
-
访问类型
-
分类:ALL,index,range,ref,eq_ref,[const,system],NULL
-
显示查询使用了那种类型,从最好到最差:system>const>eq_ref>ref>range>index>ALL
-
system:表只有一行数据(等于系统表),这是const类型的特例,平时不会出现,可以忽略不计(查询单表且只有一条记录)
-
const:表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据, 所以很快如将主键置于where列表中,MySQL 就能将该查询转换为一个常 量(单表查询的记录只有一条符合如 如:select * from student where id=1;只有一位同学id值等于1 ,主键或唯一索引,用于单个表)
-
eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯索引扫描(唯一索引,表中数据只有以个与之对应,例如:select * from student where id=1;只有一条与之匹配单表中有无数条数据,用于单表或关联表)
-
ref:非唯一性索引扫描,返回匹配某个单独值的所有行.本质上也是一种索引访问,它返回所有匹配某介单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体(非唯一索引,例如:select * from student where name=‘zs’; zs不是唯一值可以有多个叫zs 的人)
-
range:只检索给定范围的行,使用一一个索引来选择行。key 列显示使用了哪个索引一"般就是在你的where语句中出现了between、<、>、in等的查询这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某-一点,而结束语另一点,不用扫描全部索引。(含有between,in,<,>等关键字)
-
index:Full Index Scan,index与ALL区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。(也就是说虽然all和Index都是读全表,但index是从索引中读取的,而ll是从硬盘中读的){例如:select id from student; 因为id师主键索引,所以会在索引树上查找}
-
all:Full Table Scan,将遍历全表以找到匹配的行
-
-
possible_keys字段:显示可能应用到这张表中的索引,一个或多个查询涉及的字段上存在索引,则该索引被列出,但不一定被查询实际应用(理论上应用的索引)
-
key字段:实际使用的索引,如果为NULL,则没有使用索引,查询中若使用了覆盖索引,则该索引仅出现在key列表中。(实际上应用的索引){覆盖索引是指建立了复合索引,查询的字段刚好是见复合索引的字段,所以索引被覆盖了,就不会出现在possible_keys,而是只出现在key中}
-
key_len字段:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好,key_ len显 示的值为索引字段的最大可能长度,并非实际使用长度,即key_ len是 根据表定义计算而得,不是通过表内检索出的(表示查询的条件多少,条件越多key_len越长精度越高,同样的结果我们使用精度越低越好)
-
ref字段:显示索引的哪一列被使用了 ,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值(显示查这张表的时候,那一列别使用了,例如:select * from a.*,b.* where a.id=b.id where a.name="ax",在执行表a 的查询时,用到了 b.id和ac这个常量,所以 ref =库名.b.id,const)
-
rows字段:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数(就是某张表查询时检索表的行数)
-
Extra字段:包含不适合在其它列显示但十分重要的额外信息
-
Using Filesort:说明mysq|会对数据使用--个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为"文件排序"(因为建立索引mysql会按照建立复合索引的顺序帮我们自动排好序,如果我们排序的时候不是按照mysql的排序规则就需要冲新排序,这个过程就是Using Filesort)
- Using temporary:使了用临时表保存中间结果MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。(因为建立索引后mysql会自动帮我们自动排序,我们按照分组查询的时候如果不是按照建立索引的顺序进行排序,我们就需要重新排序,建立一个虚拟的表进行重新排序这个过程就是 Using Temporary)
- USING index:表示相应的select操作中使用了覆盖索引(Covering Index), 避免访问了表的数据行,效率不错!如果同时出现usingwhere,表明索引被用来执行索引键值的查找;如果没有同时出现usingwhere,表明索引用来读取数据而非执行查找动作。
-
覆盖索引(Covering Index) , 说为索引覆盖。(就是我们查询的字段刚好是建立的索引中的字段,我们无需从数据文件中读取,直接从索引中拿取即可)
-
理解方式一:就是select的数据列只用从索引中就能够取得,不必读取数据行,MySQL可以利用索引返回select列表中的字段,而不必根据索引再次读取数据文件,换句话说查询列要被所建的索引覆盖。
-
- Using where:表中使用了where过滤
- using join buffer:使用了连接缓存
- impossible where :where 的值总是false ,不能用来获取任何元组(例如where 1=0)
- select tables optimized away:在没有GROUPBY子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。
- distinct:优化distinct操作,再找到第一匹配的元组后即停止找同样值的动作
-
- 是什么(查看执行计划):