Mysql中的索引排序AND文件排序 以及 双路排序和单路排序

在Mysql中使用orderby进行排序的时候,是可以使用到索引排序的,但是需要添加一些限制条件,例如:
select * from t_user where name='张三' order by name;使用where方式就可以使用到索引,同时使用limit也是可以使用到索引的
select * from t_user order by name;通过这种方式不会使用到索引

什么时候出现索引排序,什么时候出现文件排序:

  • 索引排序:当Mysql能够使用索引来执行查询并且可以利用索引中的信息来实现排序的时候,叫索引排序
  • 文件排序:当Mysql不能通过索引中的数据实现排序,叫文件排序

Mysql中的索引排序的流程:
select id,price from likes where price=199 order by price; sql 1
select id,name,price from likes where price =199 order by price; sql 2
这里存在两种情况,一种是存在覆盖索引的情况,如果存在覆盖索引(sql 1)就会通过索引进行排序之后直接返回,第二种情况是需要进行回表查询的情况(sql 2),需要先通过索引进行排序,排序完成之后通过id回表查询我们需要的数据。
 
 

我们要尽量使用索引排序,如果没有使用索引排序,mysql就是使用文件排序(filesort)
文件排序有两种:

  • 双路排序(回表排序模式):在执行的时候,会先根据条件将排序字段和主键id(定位行数据的字段)进行取出,然后放到sortbuff中(执行排序时分配的内存)进行排序,在排序完成之后需要通过主键id回表查询出其他我们需要的数据。
  • 单路排序:在执行的时候,会将我们需要的数据都加载到sortbuff中进行排序,排序完成之后,直接将内存中的数据直接返回,不需要在进行回表查询。

这里举一个例子:
select id,name,price from likes order by price;,我们在price列中创建了索引,但是因为没有条件限制,我们还是会走filesort的

当使用单路排序的时候:
这里我们需要的数据是 id、name、price,所以他就会将对应的这三列的数据放到sortbuff中,通过对price字段进行排序,排序完成之后,直接就将数据进行返回了。

当使用双路排序的时候:
尽管我们需要id、name、price,在排序的时候,也只会将id(定位行数据的字段,建立聚簇索引的字段),price字段(通过该字段进行排序)加载到sortbuff中,通过对price字段进行排序,排序完成之后,会将排序结果集中的id进行回表查询(因为我们还需要name字段),查询出我们需要的数据,在进行返回

双路排序和单路排序的优缺点:

  • 双路排序:因为双路排序需要继续两次访问数据,所以效率较慢
  • 单路排序:单路排序只需要访问数据一次就行了,所以效率较高,但是因为单路排序是将我们需要的数据都存储在内存中,所以可能会占用更多的内存。

注意下:当sortbuff不足的时候,mysql会使用磁盘用来辅助排序,这种情况在双路排序和单路排序中都可能发生,那是不是单路排序出现这种情况的次数会更多呢?其实不然,单路排序通常不会出现这种情况,为什么呢,这需要了解什么时候使用单路排序,什么时候使用双路排序。

双路排序和单路排序如何选择的:

在排序的时候,会首先判断是索引排序还是文件排序,如果是索引排序,就通过索引排序进行,如果是文件排序,首先需要判断我们需要的字段(例如上述例子中的id、name、price)的总大小是否超过max_length_for_srot_data,如果超过了就会使用双路排序,如果没有超过就会使用单路排序。

posted @ 2024-05-08 18:50  just1t  阅读(30)  评论(0编辑  收藏  举报