mysql查询过程优化--理论及实践过程总结

首先推荐一篇写的特别详细的帖子，感觉写的太好了。全看懂了，就不用看我下面的废话了。

https://blog.52ipc.top/archives/149.html

然后记录点自己解决的经验

正式开始写一下我的优化过程：

问题：MySQL查询count（）from( 括号里有七八个left join )，导致查询速度特别慢，结果大概是40s+

1、首先在做多表链接的过程中，应该始终铭记小表驱动大表的原则，也就是说我们连接的主表应该尽量选择数据量比较小的表，在想清楚这一点后

我开始给7、8张表的连接顺序进行调整，原则就是先连接小表、简单表（连接后查询结果总数据条数不会改变），后连接复杂表（连接后查询结果总数据条数会增加，会产生交叉乘积的现象）。经过表的顺续调整以后，查询速度突然变成了10s，可把我高兴坏了，可惜依然不符合生产环境要求。。。

2、然后查到了一些编写查询语句时，应该遵循一些优化原则，具体见下：

1.能写在on里的条件，不要写在where里，能写在where里的条件不写在having里
    先执行on    再执行where      最后执行haing，所以条件越靠前越有利于sql的执行。
2.能使用left join 或者right join 的不使用inner join 或者 cross join
    其实我们在inner join 或者cross join中使用on其实就是使用where，因为mysql的执行优化器最后都回将on解析成where
3.应该使用INNER JOIN代替WHERE子句，因为INNER JOIN可以减少返回的数据量。
4.应该避免在WHERE子句中使用函数，因为这会导致MySQL无法使用索引进行优化。

3. 再要继续优化就需要从慢查询入手了。

针对一个复杂的查询，如果表比较大，连接的表比较多，一般会导致查询时间比较长，这个时候先开慢查询看一下sql的具体的查询过程。

方法：explain + sql语句

首先看第一次慢查询结果

当时对慢查询的参数还不太了解，故也没找到问题所在，其详细参数解释可以看置顶的帖子，也可以去B站看视频。也可以看这篇帖子下面那三个链接：https://www.cnblogs.com/cpl9412290130/p/10781717.html

（a）然后看上面慢查询的结果，可以看到查询type下与很多（All）这意味着在连接时要进行全表扫描，这个太低级了

　　所以这个时候就开始考虑给表增加索引，尽量使left join 后on 的条件字段是索引字段，where后的条件字段是索引字段，这样就可以通过索引进行　　　　查找，从而避免全表扫描。type从优至劣的顺序： null > system > const > eq_ref > ref > range > index > all

(b) 然后现在看extra里竟然还用了好几个distinct，简直是造孽啊

引用视频里的话： using Filesort:(九死一生)、 Using temporary:（十死无生）还有distinct 总之这几个能不用就不用，尽量去优化

然后就开始了修改sql语句之旅。终于在一个扬沙漫天的下午，把查询速度提升到了1.4s,虽然还有点慢，但至少能用了。

（c）主要提升速度的操作其实就是：修改表的连接顺序、添加索引、修改连接语句的查询过程（尽量不产生多余数据）

再附一张现在慢查询的结果图，做对比：

备注：sql count(*) 优化过程的其他方法，还可以参考：mysql count（*）关联多表怎么优化_博问_博客园 (cnblogs.com)

顺便感谢提出宝贵意见的各位博主。

最后是我自己关于慢查询的一点笔记（没学完，待补充）

-- 14 索引 04/11
 
'''
索引是一种数据结构--提高查找效率
排好序的快速查找数据结构
    影响：
        where 后的筛选条件
        order by 后的排列顺序
    BTREE:
    索引一般以索引文件的形式存储在磁盘上
    优势：
        提高数据检索的效率。降低数据库的IO成本
        通过索引列对数据进行排序，降低数据排序成本，降低CPU消耗
    劣势：
        实际上索引也是一张表，该表保存了主键与索引字段，并指向实体表的记录，所以索引列也是要占用空间的
        虽然索引大大提高了查询速度，同时却会降低更新表的速度，
            如对表进行INSERT、UPDATE和DELETE因为更新表时，MySQL不仅要保存数据，
            还要保存一下索引文件每次更新添加了索引列的字段，都会调整因为更新所带来的键值变化后的索引信息

    分类：
        单值索引：一张表可以有多个单列索引（不超过5个）
        唯一索引：索引的值必须唯一，允许有控制
        复合索引：一个索引包含多个列

        语法：
            创建：
                CREATE [UNIQUE] INDEX indexName ON mytable(columnname(length));
                ALTER mytable ADD [UNIQUE] INDEX [indexName] ON (columnname(length))
            删除：
                DROP INDEX [indexName] ON mytable;
            查看：
                SHOW INDEX FROM table_name
            使用alter命令--有四种方式来添加数据表的索引:
                ALTER TABLE tbl_name ADD PRIMARY KEY(column_list)该语句添加一个主键，这意味着索值必须是唯一的，且不能为NULL.
                ALTER TABLE bl_name ADD UNIQUE index_name (column_list): 这条语创建索引的值必须是-的(除了NULL外，NULL可能会出现多次).
                ALTER TABLE tbl_name ADD INDEX index_name(column_list): 添加普通索引，索引值可出现多次。
                ALTER TABLE tbl_name ADD FULLTEX(column_list):该语句指定了索引为 FULLTEXT，用于全文索素引
        索引结构：
            BTree索引
            Hash索引
            full-text全文索引
            R-Tree索引
    哪些情况需要创建索引：
        1.主键自动建立唯一索引
        2.频繁作为查询条件的字段应该创建索引
        3.查询中与其它表关联的字段，外键关系建立索引
        4. 频繁更新的字段不适合创建索引 因为每次更新不单单是更新了记录还会更新
        5.Where条件里用不到的字段不创建索引
        6.单键/组合索引的选择问题，who?(在高并发下倾向创建组合索引)
        7.查询中排序的字段，排序字段若通过索引去访问将大大提高排序速度
        8.查询中统计或者分组的字段
    哪些情况不需要创建索引：
        1、表太小
        2、经常增删改的表
        3、重复太多（国籍-中国）

MySql Query Optimizer--mysql自带的优化器
MySQL常见瓶颈
    CPU:CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据时候
    IO:磁盘I/O瓶颈发生在装入数据远大于内存容量的时候
Explain 
    使用EXPLAIN关键字可以模拟优化器执行SQL查询语句，从而知道MySQL是如何处理你的SOL语句的。分析你的查询语句或是表结构的性能瓶颈
    能干嘛：
        表的读取顺序--id\table
        数据读取操作的操作类型-- select_type
        哪些索引可以使用---possible_keys:
        哪些索引被实际使用--keys
        表之间的引用
        每张表有多少行被优化器查询

    explain+sql语句
        字段解释:
            id
                1、id相同，执行顺序由上至下
                2、id不同，如果是子查询，id的序号会递增，id值越大优先级越高，越先被执行
                3、id相同，不同同时存在，id如果相同，可以认为是一组，从上往下顺序执行;在所有组中，id值越大，优先级越高，越先执行
            
            select_type
                SIMPLE:简单的select，不包含union和子查询
                PRIMARY：查询中若包含任何复杂的子部分，最外层查询则被标记为PRIMARY
                SUBQUERY:在SELECT或WHERE列表中包含了子查询
                DERIVED:FROM列表中包含的子查询被标记为DERIVED(衍生)
                        mysql会递归执行这些子查询，把结果放在临时表中
                UNION:若第二个SELECT出现在UNION之后，则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为: DEVED
                UNION RESULT:

            table:

            type:
                 system ：表只有一行记录
                 const ：常出现主键索引或者唯一（where id =1）
                 eq_ref :唯一性索引扫描--只有一条匹配结果——对于每个索引建，表中只有一条记录与之匹配，常见于主键或者唯一索引扫描
                 ref 至少达到这个要求 ：非唯一性扫描，返回匹配某个单独值的所有行
                 range  至少 给定范围（where 后 >,< in between）
                 index  :从索引中读取数据
                 all    :检索全表扫描--从硬盘中读取数据
            
            possible_keys:
                显示可能应用在该张表的索引，一个或多个，查询涉及到的字段若存在索引，则该索引将被列出，但不一定查询实际使用
            key:
                查询中实际使用到的索引
                    null:没有用到该索引
                查询中若使用了覆盖索引：查的字段和所建索引的数量和名称一致
            
            key_len：表示索引中所使用的字节数，越小越好（条件越多，精度越高）

            ref:显示索引的哪一列被使用了，如果可能的话，是一个常数
                库.表.字段/const
        
            rows:
                根据表统计信息及索引选用情况，大致估算出找到所需的记录所需要读取的行数
            
            extra:
                using Filesort:(九死一生)
                Using temporary:（十死无生）
                    使了用临时表保存中间结果,MyQL在对查询结果排序时使用临时表。常见于排序 order by 和分组查询 group by。
                using index：
                    如果同时出现 using where，表明索引被用来执行索引键值的查找
                    如果没有同时出现using where，表明索引用来读取数据而非执行查找动作
                    覆盖索引 (Covering Index),一说为索引覆盖。
                    理解方式一:就是select的数据列只用从索引中就能够取得，不必读取数据行，MySQL可以利用索引返回select列表中的字段不必根据索引再次读取数据文件,换句话说查询列要被所建的索引覆盖。
                using where：
                using join buffer
                distinct

                    
'''
-- 在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这种数据结构以某种方式指向数据
-- 这样就可以在这些数据结构的基础上实现高级查找算法，这种数据结构就是索引。

posted @ 2023-04-12 18:04 Monster1728 阅读(152) 评论(0) 收藏举报

刷新页面返回顶部

Monster1728

mysql查询过程优化--理论及实践过程总结

公告