MYSQL统计和识别重复值
1、查询和计算表person_tbl中(last_name,first_name)组合有重复的记录的数量。
mysql> SELECT COUNT (*) AS repetitions, last_name, first_name
FROM person_tbl GROUP BY last_name, first_name
HAVING repetitions > 1;
2、从结果集中消除重复记录
使用DISTINCT关键字即可从结果集中消除重复记录。
mysql> SELECT DISTINCT last_name, first_name
FROM person_tbl
ORDER BY last_name;
使用GROUP BY子句。
mysql> SELECT last_name, first_name
FROM person_tbl
GROUP BY (last_name, first_name);
3、删除表中的重复记录
mysql> CREATE TABLE tmp SELECT last_name, first_name, sex
FROM person_tbl;
GROUP BY (last_name, first_name);
mysql> DROP TABLE person_tbl;
Mysql> ALTER TABLE tmp RENAME TO person_tbl;
还有一个不为人知的技巧,可以直接在一个有重复记录的表上加上主键或唯一索引,可使用ALTER IGNORE语句,命令如下。
mysql> ALTER IGNORE TABLE person_tbl
ADD PRIMARY KEY (last_name, first_name);
可以使用如上的方法消除重复记录,并且确保以后都有唯一约束。
也可以采用如下的方式,直接删除重复数据,如下语句将删除name相同的数据,其中id是主键。
DELETE t1 FROM table1 AS t1 JOIN table1 AS t2 ON t1.id>t2.id AND t1.name=t2.name;
文章基于MySQL DBA修炼之道整理,版权属于原作者