MYSQL统计和识别重复值

640?wx_fmt=jpeg


1、查询和计算表person_tbl中(last_name,first_name)组合有重复的记录的数量。

mysql> SELECT COUNT (*) AS repetitions, last_name, first_name

         FROM person_tbl  GROUP BY last_name, first_name

         HAVING repetitions > 1;

2、从结果集中消除重复记录

使用DISTINCT关键字即可从结果集中消除重复记录。

mysql> SELECT DISTINCT last_name, first_name

         FROM person_tbl

       ORDER BY last_name;

使用GROUP BY子句。

mysql> SELECT last_name, first_name

         FROM person_tbl

         GROUP BY (last_name, first_name);

3、删除表中的重复记录

mysql> CREATE TABLE  tmp SELECT last_name, first_name, sex

                                     FROM person_tbl;    

                              GROUP BY (last_name, first_name);

mysql> DROP TABLE person_tbl;

Mysql> ALTER TABLE tmp RENAME TO person_tbl;

还有一个不为人知的技巧,可以直接在一个有重复记录的表上加上主键或唯一索引,可使用ALTER IGNORE语句,命令如下。

mysql> ALTER IGNORE TABLE person_tbl

       ADD PRIMARY KEY (last_name, first_name);

可以使用如上的方法消除重复记录,并且确保以后都有唯一约束。

也可以采用如下的方式,直接删除重复数据,如下语句将删除name相同的数据,其中id是主键。

DELETE t1 FROM table1 AS t1 JOIN table1 AS t2 ON t1.id>t2.id AND t1.name=t2.name;

文章基于MySQL DBA修炼之道整理,版权属于原作者

posted @   天使不哭  阅读(908)  评论(0编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2018-07-11 nginx+asp.net mvc的配置
2018-07-11 nginx+asp.net mvc的配置
2018-07-11 nginx+asp.net mvc的配置
2017-07-11 C# 哈希表(Hashtable)用法笔记
2017-07-11 C# 哈希表(Hashtable)用法笔记
2017-07-11 C# 哈希表(Hashtable)用法笔记
2017-07-11 C# 哈希表(Hashtable)用法笔记
点击右上角即可分享
微信分享提示