MySQL笔记(3)-- SQL分析
- Linux服务器安装MySQL后,直接命令mysql进入服务,需进行修改:
/usr/bin/mysqladmin -u root password 123456
-
设置开机自启动:
chkconfig mysql on ---设置开机自启动mysql chkconfig --list|grep mysql --查看mysql的运行级别 ntsysv --看到[*]mysql这一行,表示开机后自动启动mysql
- MySQL客户端和服务器编码格式默认使用latin1,导致插入中文乱码,配置文件my.cnf进行修改字符集:
[client]节点下面添加: default-character-set=utf8 [mysqld]节点下面添加: character_set_server=utf8 character_set_client=utf8 collation-server=utf8_general_ci [mysql]节点下面添加: default-character-set=utf8
- MySQL主要配置文件信息:
- 二进制日志log-bin:主要用于主从复制;
- 错误日志log-error:默认关闭,记录严重的警告和错误信息,每次启动和关闭的详细信息等;
- 查询日志log:默认关闭,记录查询的sql语句,如果开启会降低MySQL的整体性能;
- 数据文件【每个库对应在磁盘中有下面文件】:
- frm文件:存放表结构;
- myd文件:存放表数据;
- myi文件:存放表索引;
- SQL执行加载顺序:
手写: select distinct 列表 form 表 连接类型 join 表2 on 连接条件 where 筛选条件 group by 分组列表 having 分组后的筛选 order by 排序列表 limit 偏移,条目数 机读: from 表 on 连接条件 连接类型 join 表2 where 筛选条件 group by 分组列表 having 分组后的筛选 select distinct 列表 order by 排序列表 limit 偏移,条目数
- 7种join:
- 内连接,共有部分:select A.*,B.* from A inner join B on A.id=B.id;
- 左连接:
- 共有部分+右表没有的匹配补null:select A.*,B.* from A left join B on A.id = B.id;【若建立索引进行SQL优化,需对右表B出现的字段建立索引,因为left join条件用于确定如何从右表搜索行,左边一定都有】
- 左表独有:select A.*,B.* from A left join B on A.id = B.id where B.id is null;
- 右连接:
- 共有部分+左表没有的匹配补null:select A.*,B.* from A right join B on A.id = B.id;【若建立索引进行SQL优化,需对左表A出现的字段建立索引,因为right join条件用于确定如何从左表搜索行,右边一定都有】
- 左表独有:select A.*,B.* from A right join B on A.id = B.id where A.id is null;
- 全连接union:
- 合并去重,全连接:select A.*,B.* from A left join B on A.id = B.id union select A.*,B.* from A right join B on A.id = B.id;
- 左右表独有:select A.*,B.* from A left join B on A.id = B.id where B.id is null union select A.*,B.* from A right join B on A.id = B.id where A.id is null;
- 总结:
内连接:只取两边能匹配的。
左连接:左边存在,右边不存在的也取
右连接和左连接相反
全连接:全都要
- 索引:
- 优势:提高数据检索的效率,降低数据库的IO成本;通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。
- 劣势:索引是一张表,该表保存了主键和索引字段,并指向实体表的记录,所以索引列是要占用空间的;索引提高了查找速度,但降低了更新速度,对表进行insert、update、delete时,MySQL不仅要保存数据,还要保存索引文件每次更新添加 了索引列的字段,调整更新带来的键值变化后的信息。
- 分类:
- 单值索引:一个索引只有一个列,一个表可以有多个单值索引;
- 唯一索引:索引列的值必须唯一,但可以有null值;
- 复合索引:一个索引包含多个列;
- BTree索引原理
- 索引创建的情况:
- 主键自动建立唯一索引;
- 频繁作为查询条件的字段;
- 查询中与其他表关联的字段,外键关系建立索引;
- 查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度【索引加快检索和排序速度】;
- 查询中统计或分组字段;【分组与排序配合使用,分组前必须排序】
- 高并发下倾向创建组合索引;
- 频繁更新的字段不适合创建索引;【需要更新索引信息】
- where条件里用不到的字段不创建索引;
- 字段存储的值重复,该字段不适合创建索引;
- explain,分析查询语句和表机构性能瓶颈:explain+查询SQL
- 作用:查看表的读取顺序【id】;数据读取操作的操作类型【select_type】;哪些索引可以使用【possible_key】;哪些索引实际被使用【key】;表之间的引用【ref】;每张表有多少行被优化器查询【rows】;
- 查看执行计划包含的信息
-
id:select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序【id为null,最后执行】
- id相同,执行顺序从上到下
- id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
- id相同不同,同时存在:id如果相同,可以认为是一组,从上到下顺序执行;在所有组中,id值越大,优先级越高,越先被执行;【衍生=DERIVED】
-
select_type:查询的类型,主要是用于区分普通查询、联合查询、子查询等复杂查询
- SIMPLE:简单的select查询,查询中不包含子查询或UNION;
- PRIMARY:查询中若包含任何复杂的子部分,最外层查询则为PRIMARY;【select *from A where id =(select id from B)中A表为PRIMARY】
- SUBQUERY:在select或where列表中包含了子查询;
- DERIVED:在from列表中包含的子查询为DERIVED(衍生),MySQL会递归执行这些子查询,把结果放在临时表里;
- UNION:若第二个select出现在union之后,则被标记为UNION;若UNION包含在from子句的子查询中,外层select被标记为DERIVED;【分析前面7种join中的合并去重,全连接sql】
- UNION RESULT:从UNION表获取结果的select;
-
table:显示这一行的数据是关于哪张表的;
-
type:访问类型【all、index、range、ref、eq_ref、const、system、NULL】,显示查询使用了何种类型,从最好到最差依次是system>const>eq_ref>ref>range>index>all
- system:表只有一行记录,等于系统表;
- const:表示通过索引一次就找到了,const用于比较primary key或unique索引;因为只匹配一行数据,所以很快;如将主键置于where条件中,MySQL就能将该查询转换为一个常量;
- eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配,常见于主键或唯一索引扫描;【由t2进行驱动查找】
- ref:非唯一性索引扫描,本质是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以应该属于查找和扫描的混合体
- range:只检索给定范围的行,使用一个索引来进行;一般在where条件中出现了between、<、>、in等的查询;这种范围扫描索引比全表扫描要好,因为它只需要开始于索引的某一点,结束于另一点,不用扫描全部索引;【如果索引字段是a,b,c,条件中使用了a的值是常量,b是范围,对c进行排序,会导致索引失效】【优化:对范围的字段从索引列中删除,即覆盖索引a,b,c改为a,c,从而变成ref级别】
- index:Full Index Scan全索引扫描,index与all区别为index类型只遍历索引树;通常比all快,因为索引文件通常比数据文件小;【all和index都是读全表,但index是从索引中读取,all是从磁盘中读取】
- all:全表扫描,遍历全表查找符合的数据行;
-
possible_keys:显示可以应用在这张表中索引,一个或多个;查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用;
-
key:实际使用的索引,如果没null【进行全表扫描】,则没有使用索引;查询中若使用了覆盖索引,则该索引仅出现在key列表中【查询的字段个数、顺序与索引一一对应】;
-
key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度;在不损失精确性的情况下,长度越短越好;key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的;
-
ref:显示索引的哪一列被使用了【库名.表名,被使用列名】,如果可能的话,是一个常数【const】;哪些列或常量被用于查找索引列上的值;
-
rows:根据表统计信息及索引选用情况,大致估算出找到所需记录所需要读取的行数;
-
extra::包含不适合在其他列中显示但十分重要的额外信息
- Using filesort:说明MySQL会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取【创建了一个组合索引包含a,b,c,但在where条件和order by排序时,只使用了a,c,导致这个索引出现了断层,会出现文件排序】;MySQL中无法利用索引完成的排序操作称为“文件排序”;
- Using temporary:使用了临时表保存中间结果,MySQL在对查询结果进行排序时使用临时表,常见于排序order by和分组查询group by;【临时表增加数据库负担】
- Using index:表示相应的select操作中使用了覆盖索引【覆盖索引:创建的索引包含a,b,进行select查询的列全包含或部分包含如a,b或a】,避免访问了表的数据行,效率不错;如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有同时出现using where,表明索引用来读取数据而非执行查找动作;
- Using where:表明使用了where过滤;
- using join buffer:使用了连接缓存;【出现在多表的inner join内连接中】【最好在my.cnf配置文件中的缓存调大点】
- impossible where: where子句的值总是false,不能用来获取任何元组;
- select tables optimized away:在没有group by子句的情况下,基于索引优化MIN/MAX操作或对于MyISAM存储引擎优化count(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化;
- distinct:优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作;
-
作者:huangrenhui
欢迎任何形式的转载,但请务必注明出处。
如果,您认为阅读这篇博客让您有些收获,不妨点击一下右下角的【推荐】。
如果,您希望更容易地发现我的新博客,不妨点击一下左下角的【关注我】。
如果,您对我的博客所讲述的内容有兴趣,请继续关注我的后续博客,我是【码猿手】。
如果,您希望更容易地发现我的新博客,不妨点击一下左下角的【关注我】。
如果,您对我的博客所讲述的内容有兴趣,请继续关注我的后续博客,我是【码猿手】。
限于本人水平,如果文章和代码有表述不当之处,还请不吝赐教。