mysql 中sql执行顺序
关键字简述:
- FROM:确定数据来源,即指定表;
- JOIN...ON:确定关联表和关联条件;
- WHERE:指定过滤条件,过滤出满足条件的数据;
- GROUP BY:按指定的字段对过滤后的数据进行分组;
- HAVING:对分组之后的数据指定过滤条件;
- SELECT:查找想要的字段数据;
- DISTINCT:针对查找出来的数据进行去重;
- ORDER BY:对去重后的数据指定字段进行排序;
- LIMIT:对去重后的数据限制获取到的条数,即分页;
1、执行FROM语句
第一步是执行from语句,找到<left_table>
和<right_table>
两张表,再做笛卡尔积,不管是否有对应关系,全都做好对应。把两张表的记录全部拼到一起。得到第一张虚拟表VT1。
2、执行ON过滤
第二步执行ON关键字,一个连表的依据,只取leftt_able.xx=right_table.xx的一个字段。在笛卡尔积的基础上,取两张表有对应关系的记录。得到第二张虚拟表VT2。
3、添加外部行
实际就是实行JOIN类型,如LEFT OUTER JOIN
、RIGHT OUTER JOIN
和FULL OUTER JOIN
。在大多数的时候,我们都是会省略掉OUTER
关键字的,但OUTER
表示的就是外部行的概念。在VT2的基础留下左表或者右边呃记录,得到虚拟表VT3。
4、执行where过滤
添加外部行得到的VT3进行WHERE过滤,只有符合<where_condition>的记录才会输出到虚拟表VT4中。
5、执行GROUP BY分组
GROU BY
子句主要是对使用WHERE
子句得到的虚拟表进行分组操作。得到的内容会存入虚拟表VT5中,此时,我们就得到了一个VT5虚拟表
6、执行HAVING过滤
HAVING
子句主要和GROUP BY
子句配合使用,对分组得到的VT5虚拟表进行条件过滤。得到VT6虚拟表
7、SELECT列表
现在才会执行到SELECT
子句(不要以为SELECT
子句被写在第一行,就是第一个被执行的)。
执行SELECT语句从VT6中选择出需要的内容。
8、DISTINCT子句
如果在查询中指定了DISTINCT
子句,则会创建一张内存临时表(如果内存放不下,就需要存放在硬盘了)。
临时表的表结构和上一步产生的虚拟表VT7是一样的,不同的是对进行DISTINCT操作的列增加了一个唯一索引,以此来除重复数据。
9、ORDER BY子句
对虚拟表中的内容按照指定的列进行排序,然后返回一个新的虚拟表VT8。
10、执行LIMIT子句
LIMIT
子句从上一步得到的VT8虚拟表中选出从指定位置开始的指定行数据。对于没有应用ORDER BY的LIMIT子句,得到的结果同样是无序的,所以,很多时候,我们都会看到LIMIT子句会和ORDER BY子句一起使用。
MySQL数据库的LIMIT支持如下形式的选择:
- LIMIT n, m
表示从第n条记录开始选择m条记录。而很多开发人员喜欢使用该语句来解决分页问题。对于小数据,使用LIMIT子句没有任何问题,当数据量非常大的时候,使用LIMIT n, m
是非常低效的。因为LIMIT的机制是每次都是从头开始扫描,如果需要从第60万行开始,读取3条数据,就需要先扫描定位到60万行,然后再进行读取,而扫描的过程是一个非常低效的过程。所以,对于大数据处理时,是非常有必要在应用层建立一定的缓存机制(现在的大数据处理,大都使用缓存)