高性能MySQL
一、MySQL索引引擎对比
二、性能下降SQL慢,执行时间长,等待时间长
① 查询语句写的差
② 索引失效
③ 关联查询太多join(设计缺陷或不得已的需求)
④ 服务器调优及各个参数设置(缓冲,线程数等)
三、手写与机写SQL
手写模板:
SELECT DISTINCT <select_list> FROM <left_table> <join_type> JOIN <right_table> ON <join_condition> WHERE <where_condition> GROUP BY <group_by_list> HAVING <having_condition> ORDER BY <order_by_condition> LIMIT <limit_number>
机写模板
1 FORM <left_table> 2 ON <join_condition> 3 <join_type> JOIN <right_table> 4 WHERE <where_condition> 5 GROUP BY <group_by_list> 6 HAVING <having_condition> 7 SELECT 8 DISTINCT <select_list> 9 ORDER BY <order_by_condition> 10 LIMIT <limit_number>
四、笛卡积
五、索引
5.1 mysql索引分类
单值索引:一个索引只包含单个列,一个表可以有多个单列索引
唯一索引:索引列的值必须唯一,但允许有空值
复合索引:一个索引包含多个列
基本语法:
创建:1.CREATE [UNIQUE] indexName ON mytable (columnname(length));——如果是CHAR,VARCHAR类型,length可以小于字段实际长度,如果是BLOB和TEXT类型,必须指定length。
2.ALTER mytable ADD [UNIQUE] INDEX [indexName] ON (columnname(length))
删除:DROP INDEX [IndexName] ON mytable
查看:SHOW INDEX FROM table_name\G
table user: id name email phone address select * from user where name =""; // 在表user上建立name的索引 create index idx_user_name on user(name);
5.2、mysql索引结构
B+Tree索引、Hash索引、full-text全文索引、(空间数据索引)R-Tree
5.3、B+Tree索引的查询类型
1、全值匹配:和索引中的所有列进行匹配
2、匹配最左前缀
3、匹配列前缀
4、匹配范围值
5、精确匹配某一列并范围匹配另外一列
6、只访问索引的查询
同理:B+Tree索引限制
1、如果不是按照索引的最左列开始查找,则无法使用索引。
2、不能跳过索引的列
3、如果查询中有个列的范围查询,则其右边所有列都无法使用索引优化查找。
5.4、索引的优点
1、索引大大减少了服务器需要扫描的数据量。
2、索引可以帮助服务器避免排序和临时表。
3、索引可以将随机I/O变成顺序I/O。
就、索引策略
1、前缀索引和索引选择性。
选择足够长的前缀以保证较高的选择性,不能太长(以便节省空间),但得足够长,使得前缀索引的选择性接近于索引这个列。
2、选择合适的索引列顺序。
当不考虑排序和分组时,将选择性最高的列放在前面,此时索引的作用只是优化WHERE条件的查找。
5.5、聚簇索引
聚簇索引不是索引类型,而是数据存储方式。InnoDB的聚簇索引——同一结构中保存了B+Tree索引和数据行。
当表有聚餐索引时,它的数据行实际上存放在索引的叶子页中。
如果没有定义主键,InnoDB会选择一个唯一的非空索引替代。如果没有这样的索引,InnoDB会隐式的定义一个主键来作为聚簇索引。
聚簇索引的优点:
1、可以把关联数据保存在一起。
2、数据访问更快。聚簇索引将索引和数据保存在同一个B+Tree中,因此从聚簇索引中获取数据通常比非聚簇索引中查找要快。
3、使用覆盖索引扫描的查询可以直接使用叶节点的主键值。
注意:二级索引需要两次索引查找:二索引叶子节点保存是行的主键值。先B-Tree查主键值,再B-Tree聚簇索引查对应的行。
页分裂:一个数据页满了,按照B+Tree算法,新增加一个数据页,叫做页分裂,会导致性能下降。空间利用率降低大概50%。当相邻的两个数据页利用率很低的时候会做数据页合并,合并的过程是分裂过程的逆过程。
5.6、覆盖索引
如果一个索引包含(覆盖)所有需要查询的字段的值——覆盖索引。
优点:
1、索引条目通常小于书数据行大小,如果只需要读取索引,那mysql就会极大减少数据访问量。
2、因为索引是按照列值顺序存储的,所以对于I/O密集型的范围查找会比随机从磁盘中读取每一行的数据I/O要少得多。
3、由于InnoDB的聚簇索引,覆盖索引对InnoDB表特别有用。InnoDB的二级索引在叶子节点保存了行主键值,如果二级索引能够覆盖查询,那么就避免对主键索引的二次查询。
索引下推:在MySQL5.6之前,只能从根据最左前缀查询到ID开始一个个回表。到主键索引上找出数据行,再对比字段值。MySQL5.6引入的索引下推优化,可以在索引遍历过程中,对索引中包含的字段先做判断,直接过滤掉不满足条件的记录,减少回表次数。
5.7、索引扫描做排序
mysql有两种方式可以生成有序的结果:通过排序操作;或者按索引顺序扫描;如果EXPLAIN出来的type列的值为“index”,则说明mysql使用了索引扫描来排序。
mysql可以使用同一索引即满足排序,有用于查找行。因此,设计索引尽可能满足这两种任务。
只有当索引的列顺序和ORDER BY字句的顺序完全一样,并且所有列的排序方向(倒序或正序)都一样,mysql才能使用索引对结果排序。
5.8、创建索引建议
1、主键自动建立唯一索引
2、频繁作为查询条件的字段
3、查询中与其他表关联的字段,外键关系
4、频繁更新的字段不适合
5、查询中排序的字段(见八)
6、查询中统计或者分租。
5.9、索引使用注意
1、全值匹配
2、最佳左前缀法则:索引多列,要遵守最左前缀法则,查询从最左开始,不跳列
3、不在索引上做任务操作(计算、函数、(手动或自动)类型转化),会导致索引失效全表扫描
4、尽量使用覆盖索引,减少select *
5、mysql在使用不等于(!=或<>)无法使用索引
6、is null,is not null无法使用索引
7、like以通配符开头,索引失效
8、字符串不加单引号,索引失效
9、少用or,用它来连接时索引会失效。
六、Mysql常见瓶颈
CPU:CPU在饱和的时候发生在数据装入内存或从磁盘上读取数据时候
IO:磁盘I/O瓶颈发生在装入数据远大于内存容量的时候
服务器硬件的性能瓶颈:top,free,iostat和vmstat来查看系统的性能状态。
七、执行计划(Explain SQL)
id | select_type | table | type | possible_keys | key | ken_len | ref | rows | Extra |
作用:
表的读取顺序
数据读取操作的操作类型
哪些索引可以使用
那些索引被实际使用
表之间的引用
每张表有多少行被优化器查询
重点关注:id——select_type——type——key——rows——Extra
7.1 id:如果相同,可以认为是一组,从上往下顺序执行;在所有组中,id值越大,优先级越高,越先执行
7.2 select_type:
① SIMPLE:简单的select查询,查询中不包含子查询或者UNION
② PRIMARY:查询中若包含任何复杂的子查询,最外层查询则被标记为
③ SUBQUERY:在SELECT 或WHERE列表中包含子查询
④ DERIVED:在FROM列表中包含的子查询被标记为DERIVED(衍生),mysql会递归执行这些子查询,把结果放在临时表里。
⑤ UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子查询中,外层SELECT将被标记为:DERIVED
⑥ UNION RESULT:从UNION表获取结果的SELECT
7.3 type——访问类型排列
显示查询使用了何种类型,最好到最差:system>const>eq_ref>ref>rang>index>ALL
7.4 Extra——额外信息
① Using filesort(需要文件排序辅助处理,差)
② Using temporary(需要临时表辅助处理,很差)
③ Using index(用到索引,好)
④ using where
⑤ using join buffer(使用了连接缓存,差)
⑥ impossible where
⑦ select tables optimized away
⑧ distinct
八、索引优化
① 单表索引
② 两表索引:left join(建立在右表):左表是全部都要走一遍的(可以根据主键),右边才是关注重点,通过索引快速定位。同理,right join(索引建立在左表)。
③ 三表索引:建立在后面两张表关联字段上。
Join语句的优化:
(1)尽可能减少Join语句中的NestedLoop的循环总次数;用小结果集驱动大结果集。
(2)优先优化NestedLoop的内层循环
(3)保证Join语句中被驱动表上Join条件字段已经被索引;
(4)当无法保证被驱动表的Join条件字段被索引且内存资源充足的前提下,不要太吝惜JoinBuffer的设置。
题目分析:
定值、范围还是排序,一般order by是给个范围;group by基本上都需要进行排序,会有临时表产生。
一般建议:
① 对于单键索引,尽量选择针对当前query过滤性更好的索引
② 在选择组合索引的时候,当前query中过滤性最好的字段在索引字段排序中,应该位置越靠前越好。
③ 在选择组合索引的时候,尽量选择可以能够包含当前query中的where字句中更多字段的索引
④ 尽可能通过分析统计信息和调整query的写法来表达合适索引的目的。
posted on 2019-07-09 21:35 betterLearing 阅读(520) 评论(0) 编辑 收藏 举报