yamlln

导航

MySQL 中的 distinct 和 group by 哪个效率更高?

 
1、distinct用法

 语法:

SELECT DISTINCT columns FROM table_name WHERE where_conditions;

 举例:

     多列去重:distinct多列的去重,则是根据指定的去重的列信息来进行,即只有所有指定的列信息都相同,才会被认为是重复的信息。

     

 

2、group by用法

  语法:

SELECT columns FROM table_name WHERE where_conditions GROUP BY columns;

  举例: 

  多列去重:两者的语法区别在于,group by可以进行单列去重,group by的原理是先对结果进行分组排序,然后返回每组中的第一条数据。且是根据group by的后接字段进行去重的。

      

 3、distinct 和 group by  区别

  • 在语义相同,有索引的情况下:

    group by和distinct都能使用索引,效率相同。因为group by和distinct近乎等价,distinct可以被看做是特殊的group by

  • 在语义相同,无索引的情况下:

    distinct效率高于group by。原因是distinct 和 group by都会进行分组操作,但group by在Mysql8.0之前会进行隐式排序,导致触发filesort,sql执行效率低下。

    但从Mysql8.0开始,Mysql就删除了隐式排序,所以,此时在语义相同,无索引的情况下,group by和distinct的执行效率也是近乎等价的。

   推荐group by的原因

  1. group by语义更为清晰
  2. group by可对数据进行更为复杂的一些处理

   相比于distinct来说,group by的语义明确。且由于distinct关键字会对所有字段生效,在进行复合业务处理时,group by的使用灵活性更高,group by能根据分组情况,对数据      进行更为复杂的处理,例如通过having对数据进行过滤,或通过

posted on 2023-04-12 13:21  yamlln  阅读(241)  评论(0编辑  收藏  举报