order by原理

前置知识

Using filesort：表示需要用到 sort buffer 内存空间进行排序
sort buffer 是一块可调整的内存空间，如果需要排序的数据量太大而空间不够，将用到磁盘临时文件来排序，效率很低

什么情况下会用到 sort buffer 来排序？

不能根据索引直接知道排序结果，就需要用到 sort buffer

排序的执行情况？

表T：id (primary key), city (key), name, age 等字段

explain select city,name,age from T where city = 'gz' order by name;
-- 走了索引(但是是非覆盖索引)，需要排序，需要进行回表查询
-- Using index condition; Using filesort

这个 SQL语句可以知道，不能根据索引直接知道排序结果，所以需用到 sort buffer 排序

● 全字段排序执行流程
初始化 sort buffer，确定此内存中需要存放的字段
到 city 字段索引上找到匹配的第一行
回表查询，把 city,name,age 存到 sort buffer 中
重复上述两步，直到不满足 where 条件(city 索引上找到一行不满足的数据)
对 sort buffer 中的数据排序
返回结果集给客户端

● rowid 排序执行流程
排序前，会检测放入 sort buffer 中的字段的长度，如果超过最大单行长度值(可调)，那么就会只放rowid 和需要排序的字段

explain select city,name,age from T where city = 'gz' order by name;
-- 走了索引(但是是非覆盖索引)，需要排序，需要进行回表查询
-- Using index condition; Using filesort

MySQL如果检测到 city,name,age 等字段超过了最大单行长度值，就会只把 id, name 等字段放入 sort buffer 中

执行流程
相比全字段排序，基本流程一致。存入 sort buffer 中的字段变少了，在排序完后，又要回表查询然后返回结果集。效率变低了
这个排序机制是为了保证尽可能的使用 sort buffer 内存排序，减少内存存放的数据行，那么存放的数据量就更多。从而降低/不适用磁盘临时文件排序

如何优化？

可以这样创建普通索引 (city, name)。那么执行上述 SQL 语句时，不会用到内存排序
执行流程
到 city 字段索引上找到匹配的第一行
回表查询，把 city,name,age 作为结果集的一部分直接返回
重复上述两步，直到不满足 where 条件

posted @ 2023-02-05 18:01 pzistart 阅读(82) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 唯一/普通索引的选择？change buffer

· 1.2复习了一下MySQL的索引

· 16 | “order by”是怎么工作的？

· MySQL order by 排序的两种方式以及排序原理

· Mysql 系列 | order by

阅读排行：
· 无需6万激活码！GitHub神秘组织3小时极速复刻Manus，手把手教你使用OpenManus搭建本
· Manus爆火，是硬核还是营销？
· 终于写完轮子一部分：tcp代理了，记录一下
· 别再用vector＜bool＞了！Google高级工程师：这可能是STL最大的设计失误
· 单元测试从入门到精通

公告

扫码关注公众号，获取所有代码

昵称： pzistart
园龄： 2年5个月
粉丝： 4
关注： 1

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类

随笔档案

阅读排行榜

评论排行榜

1. 【教你写爬虫】用Java爬虫爬取百度搜索结果！可爬10w+条！(2)

pzistart