MS SQL Server 删除重复行数据

您可以使用以下 SQL 语句删除 MS SQL Server 表中重复的行：

WITH CTE AS (
  SELECT ROW_NUMBER() OVER(PARTITION BY column1, column2, ... columnN ORDER BY (SELECT 0)) RN
  FROM table_name
)
DELETE FROM CTE WHERE RN > 1;

您需要将 table_name 替换为要删除重复行的表名，并将 column1, column2, ... columnN 替换为用于检查重复的列名。该语句使用 ROW_NUMBER() 函数和 PARTITION BY 子句来标识重复的行，然后使用 DELETE 语句删除其中一个副本。

这样说有些抽象，下面举一个例子：

比如我有一个deadUrlRecord_copy1 表，存的数据如下格式。

这个表存在一个问题，url列有一部分是重复的。用group by语句可以查出来，有挺多重复的，那么，如何删除多余的数据，只保留一条呢？

这就要采用文章开头给出的语句了。

WITH cte AS (
    SELECT url,
           ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn
    FROM deadUrlRecord_copy1
    WHERE status = 'NotFound'
)
DELETE FROM cte WHERE rn > 1;

乍一看一脸懵逼，但是执行发现竟然成功删除了重复数据，达到了预期效果，为什么呢？

这要解释下这一行代码：

ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn

这是一种 SQL 语法，用于对一个查询结果集的行进行编号，并且可以根据特定列来分组编号。

具体来说，ROW_NUMBER() 是一个窗口函数，它会为查询结果集中每一行计算一个行号。而 OVER 子句则是指定如何定义窗口（window），也就是要给哪些行计算行号。在这个例子中，PARTITION BY url 表示按照 url 这一列进行分组，也就是说对于每个不同的 url 分别计算行号；ORDER BY url 则表示按照 url 这一列进行排序，这样同一个 url 中的行就会按照 url 的值依次排列。最后，AS rn 则是给这个新的行号列起个名字，即 rn。

例如，假设有如下表格：

id	url
1	www.example.com
2	www.example.com
3	www.example.com/foo
4	www.example.com/bar
5	www.google.com

如果执行以下 SQL 查询：

SELECT id, url, ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn FROM my_table;

则会得到以下结果：

id	url	rn
1	www.example.com	1
2	www.example.com	2
3	www.example.com/foo	1
4	www.example.com/bar	1
5	www.google.com	1

其中，同一个 url 中的行拥有相同的行号，同时这个行号是按照 url 的值进行排序的。

然后执行刚才那段代码的片段试一下，可能更好理解：

url不同的，行号都是1。相同的，会从1开始排序，所有就出现了2.

然后用 DELETE FROM cte WHERE rn > 1; 删除行号>1的数据，就成功把多余的数据删除了，非常巧妙。

posted @ 2023-03-17 16:55 超难微猫阅读(926) 评论(2) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· .net中如何证明List<int>是线程非安全的

· 记笔记背单词网站开发记录1

· MS SQL Server 删除重复行数据

· oracle删除表中重复的行数据

· SqlServer中根据某几列获取重复的数据将其删除并保留最新一条

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？
· 展开说说关于C#中ORM框架的用法！

公告

昵称：超难微猫
园龄： 6年2个月
粉丝： 6
关注： 9

+加关注

2025年3月

日

一

二

三

四

五

六

Walker

MS SQL Server 删除重复行数据

公告

搜索

常用链接

最新随笔

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论