Mysql中distinct与group by 去重
distinct 与 group by均可用于去重,但distinct 侧重于查询出的数据完全相同时去重,
group by属于聚合函数,只能根据分组的字段进行去重,且查询字段不包含分组字段也不会出错。
单纯的去重distinct快于group by
distinct
distinct支持单列、多列的去重方式。
单列去重的方式简明易懂,即相同值只保留1个。
多列的去重则是根据指定的去重的列信息来进行,即只有所有指定的列信息都相同,才会被认为是重复的信息。
例如:
原始数据:
SELECT user_name,msg,phone FROM `send_message`;
单列去重
SELECT distinct user_name FROM `send_message`;
耗时: 0.01s
多列去重:
SELECT distinct user_name,msg,phone FROM `send_message`
耗时:0.011s
Group by
group by根据by对数据按照哪个字段进行分组,或者是哪几个字段进行分组。
例如:
原数据:
SELECT id,user_name,msg,phone FROM `send_message`;
根据手机号分组:
方式一:
SELECT id,user_name,msg,phone FROM `send_message` GROUP BY phone ;
耗时: 0.013s
注:此处筛选出相同号码中的首条记录。
方式二:
SELECT user_name,msg,phone FROM `send_message` WHERE id IN (SELECT min(id) from send_message group by phone);
耗时:0.012s
总结:去重建议使用distinct进行去取重,原因:
1)性能优于group by;
2)类似于SQLServer数据库使用group by的语法,没有出现再查询中聚合函数使用的字段就必须出现在group by中,
若要使用group by去重,建议使用group by中的方式二。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· spring官宣接入deepseek,真的太香了~