sqlserver合交并差（转载）

转载来源：https://www.jb51.net/article/191585.htm

概述

为什么使用集合运算：

　　在集合运算中比联接查询和EXISTS/NOT EXISTS更方便。

并集运算（UNION）

并集：两个集合的并集是一个包含集合A和B中所有元素的集合。

在T-SQL中。UNION集合运算可以将两个输入查询的结果组合成一个结果集。需要注意的是：如果一个行在任何一个输入集合中出现，它也会在UNION运算的结果中出现。T-SQL支持以下两种选项：

（1）UNION ALL：不会删除重复行

-- union allselect 
country, region, city from hr.Employees
union all
select country, region, city from sales.Customers;

（2）UNION：会删除重复行

-- union
select country, region from hr.Employees
union
select country, region from sales.Customers;

交集运算（INTERSECT)

交集：两个集合（记为集合A和集合B）的交集是由既属于A，也属于B的所有元素组成的集合。

在T-SQL中，INTERSECT集合运算对两个输入查询的结果取其交集，只返回在两个查询结果集中都出现的行。

　　INTERSECT集合运算在逻辑上会首先删除两个输入集中的重复行，然后返回只在两个集合中中都出现的行。换句话说：如果一个行在两个输入集中都至少出现一次，那么交集返回的结果中将包含这一行。

　　例如，下面返回既是雇员地址，又是客户地址的不同地址：

-- intersect
select country, region, city from hr.Employees
intersect
select country, region, city from sales.Customers;

这里需要说的是，集合运算对行进行比较时，认为两个NULL值相等，所以就返回该行记录。

差集运算（EXCEPT）

差集：两个集合（记为集合A和集合B）的由属于集合A，但不属于集合B的所有元素组成的集合。

　在T-SQL中，集合之差使用EXCEPT集合运算实现的。它对两个输入查询的结果集进行操作，反会出现在第一个结果集中，但不出现在第二个结果集中的所有行。

　　EXCEPT结合运算在逻辑上首先删除两个输入集中的重复行，然后返回只在第一个集合中出现，在第二个结果集中不出现的所有行。换句话说：一个行能够被返回，仅当这个行在第一个输入的集合中至少出现过一次，而且在第二个集合中一次也没出现过。

　　此外，相比UNION和INTERSECT，两个输入集合的顺序是会影响到最后返回结果的。

　　例如，借助EXCEPT运算，我们可以方便地实现属于A但不属于B的场景，下面返回属于员工抵制，但不属于客户地址的地址记录：

-- except 
select country, region, city from hr.Employees
except
select country, region, city from sales.Customers;

集合运算优先级

SQL定义了集合运算之间的优先级：INTERSECT最高，UNION和EXCEPT相等。

　　换句话说：首先会计算INTERSECT，然后按照从左至右的出现顺序依次处理优先级相同的运算。

-- 集合运算的优先级
select country, region, city from Production.Suppliers
except
select country, region, city from hr.Employees
intersect
select country, region, city from sales.Customers;

上面这段SQL代码，因为INTERSECT优先级比EXCEPT高，所以首先进行INTERSECT交集运算。因此，这个查询的含义是：返回没有出现在员工地址和客户地址交集中的供应商地址。

集合运算的优先级

1.INTERSECT>UNION=EXCEPT

2.首先计算INTERSECT,然后从左到右的出现顺序依次处理优先级的相同的运算。

3.可以使用圆括号控制集合运算的优先级，它具有最高的优先级。

在排序函数的OVER字句中使用ORDER BY ( SELECT <常量> )可以告诉SQL Server不必在意行的顺序。

使用表表达式避开不支持的逻辑查询处理

集合运算查询本身并不持之除ORDER BY意外的其他逻辑查询处理阶段，但可以通过表表达式来避开这一限制。

　　解决方案就是：首先根据包含集合运算的查询定义一个表表达式，然后在外部查询中对表表达式应用任何需要的逻辑查询处理。

（1）例如，下面的查询返回每个国家中不同的员工地址或客户地址的数量：

select country, COUNT(*) as numlocations
from (select country, region, city from hr.Employees 
union 
select country, region, city from sales.Customers) as Ugroup by country;

（2）例如，下面的查询返回由员工地址为3或5的员工最近处理过的两个订单：、

select empid,orderid,orderdate 
from (select top (2) empid,orderid,orderdate 
 from sales.Orders
 where empid=3
 order by orderdate desc,orderid desc) as D1
union all
select empid,orderid,orderdate 
from (select top (2) empid,orderid,orderdate 
 from sales.Orders
 where empid=5
 order by orderdate desc,orderid desc) as D2;

转载来源二：https://www.cnblogs.com/kissdodog/archive/2013/06/24/3152743.html

　为了配合测试，特地建了两个表，并且添加了一些测试数据，其中重复记录为东吴的人物。

　　表：Person_1魏国人物

　　表：Person_2蜀国人物

　　A、Union形成并集

　　　　Union可以对两个或多个结果集进行连接，形成“并集”。子结果集所有的记录组合在一起形成新的结果集。

　　　 1、限定条件

　　　　　要是用Union来连接结果集，有4个限定条件。

　　　　　(1)、子结果集要具有相同的结构。

　　　　　(2)、字结果集的列数必须相同。

　　　　　(3)、子结果集对应的数据类型必须可以兼容。

　　　　　(4)、每个子结果集不能包含order by和compute子句。

　　　 2、语法形式

　　　　select_statement union [all] select_statement

　　　all代表最终的结果集中将包含所有的行，而不能删除重复行。

　　　示例：

　　SELECT Name FROM Person_1
　　UNION
　　SELECT Name FROM Person_2

　　　生成的结果为：

　　注意到重复记录，孙权与周瑜仅仅显示了一个。下面来将UNION替换成UNION ALL看看是什么结果：

　　SELECT Name FROM Person_1
　　UNION ALL
　　SELECT Name FROM Person_2

　　注意到重复记录，孙权与周瑜出现了两次，这就是UNION ALL 与 UNION的不同之处。

　　　B、Except形成差集

　　　Except可以对两个或多个结果集进行连接，形成“差集”。返回左边结果集合中已经有的记录，而右边结果集中没有的记录。

　　　限定条件：

　　　　1、子结果集要具有相同的结构。

　　　　2、子结果集的列数必须相同。

　　　　3、子结果集对应的数据类型必须可以兼容。

　　　　4、每个子结果集不能包含order by 和 compute子句。

　　　　语法形式：

　　　　select_statement except select_statement

　　　　自动删除重复行。

　　　　示例：

　　SELECT Name FROM Person_1
　　EXCEPT
　　SELECT Name FROM Person_2

　　　　结果：

　　　　留意到表Person_2有的，孙权周瑜已被去除。

　　C、InterSect形成交集

　　　　InterSect可以对两个或多个结果集进行连接，形成“交集”。返回左边结果集和右边结果集中都有的记录。

　　1、限定条件　　

　　　　要是用Except来连接结果集，有4个限定条件。

　　　　(1)、子结果集要具有相同的结构。

　　　　(2)、子结果集的列数必须相同。

　　　　(3)、子结果集对应的数据类型必须可以兼容。

　　　　(4)、每个子结果集不能包含order by或compute子句。

　　2、语法形式

　　select_statement intersect select_statement

　　示例：

　　SELECT Name FROM Person_1
　　INTERSECT
　　SELECT Name FROM Person_2

　　　返回的结果如下：

　　　留意到只取两张表都有的记录(周瑜，孙权)，这就是所谓的交集。

　　D、结果集的排序

　　SELECT Name FROM Person_1
　　INTERSECT
　　SELECT Name FROM Person_2
　　ORDER BY Name DESC　　　　--此处的字段名相同了，如果不同，请切记排序列名，只能够是第一个表的列名

　　这里只有两点要注意

　　1.ORDER BY是对整个运算后的结果排序，并不是对单个数据集。

　　2.ORDER BY后面排序的字段名称是第一个数据集的字段名或者别名。

posted @ 2022-07-25 11:26 hao_1234_1234 阅读(139) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· SQLSERVER 交、并、差集，In,Not In,Exist,Not Exist的区别，四种连接（转载）

· .NET Core 分层

· 读SQL进阶教程笔记04_集合运算

· 7.15 SQL Server UNION联合查询（并集）

· SQL 如何进行并集、交集、差集等集合运算

阅读排行：
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了
· 上周热点回顾（2.24-3.2）

公告

昵称： hao_1234_1234
园龄： 8年6个月
粉丝： 75
关注： 79

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类

转载(240)

hao_1234_1234

sqlserver合交并差（转载）

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论