MySQL中的 distinct 和 group by 哪个效率更高?
在语义相同,有索引的情况下:
group by
和distinct
都能使用索引,效率相同。因为group by
和distinct
近乎等价,distinct
可以被看做是特殊的group by
。
在语义相同,无索引的情况下:
distinct
效率高于group by
。原因是distinct
和 group by
都会进行分组操作,但group b
y在Mysql8.0
之前会进行隐式排序,导致触发filesort
,sql
执行效率低下。
但从Mysql8.0
开始,Mysql
就删除了隐式排序,所以,此时在语义相同,无索引的情况下,group by
和distinct
的执行效率也是近乎等价的。
推荐group by
的原因
-
group by
语义更为清晰 -
group by
可对数据进行更为复杂的一些处理
相比于distinct
来说,group by
的语义明确。且由于distinct
关键字会对所有字段生效,在进行复合业务处理时,group by
的使用灵活性更高,group by
能根据分组情况,对数据进行更为复杂的处理,例如通过having
对数据进行过滤,或通过聚合函数对数据进行运算。