SQL语句中 NOT IN 子句的“正确打开方式”

在写SQL语句的时候,若where条件是判断用户不在某个集合当中,我们习惯使用 where 列名 not in (集合) 子句,这种写法本身没有问题,但实践过程中却发现很多人在写类似的SQL语句时,写的代码存在隐患,而这种隐患往往难以发现。

 

1. 存在隐患的写法

首先,我们来评估一条简单的SQL语句的输出结果。语句如下:

select 1 from dual where 1 not in(2, null)

简单,输出结果是1嘛。

错!答案是没有输出结果。

为什么会这样?数据库管理系统在执行查询之前,会对上面语句进行简单的转化,转化之后的语句如下:

select 1 from dual where 1 != 2 and 1 != null

显然,where后面的表达式中,1!=2的结果是true,但1!=null的结果是不确定true不确定进行与运算的结果非true,所以上述语句的没有输出结果。

分析完了上面这条语句,我们再来看一个问题,假设有员工表DEMPLOYEES和部门表DEPARTMENTS,写SQL语句找出2015年没有招人的部门。我们可以很快的写出下面语句:

select DEPARTMENT_ID, DEPARTMENT_NAME from DEPARTMENTS where DEPARTMENT_ID not in(
    select DEPARTMENT_ID from EMPLOYEES where HIRE_DATE like '%2015%'
)

若员工表EMPLOYEES中存在还未分配部门的员工时,子查询中的结果集中会含NULL元素,这就和开始我们评估的语句套上了,语句将无结果返回。那么,该如何写这种形式的语句才能避免隐患呢?

2. NOT IN 子句正确的打开方式

为了避免NOT IN子句的隐患,最简单的方式就是不使用NOT IN子句,而使用其他的形式达到相同的效果。你老是出问题,我不跟你玩行了吧!例如使用 not exists子句将上述语句改写正确之后代码如下:

select DEPARTMENT_ID, DEPARTMENT_NAME from DEPARTMENTS where not exists (
    select * from EMPLOYEES where EMPLOYEES.DEPARTMENT_ID = DEPARTMENTS.DEPARTMENT_ID and  HIRE_DATE like '%2015%'
)

若还是想用 NOT IN子句,怎么办?有方法,就是对子查询返回的结果进行处理,如果为空值NULL,则给它赋一个非空值。这种对空值NULL的处理,各类数据库管理系统都有相应函数函数支持,例如SQL Server中的 ISNULL函数,Oracle 中的NVLNVL2COALESE,以及MySQL中的IFNULL , COALESE

以SQL Server为例,如下SQL语句也能够像NOT EXISTS子句一样避免隐患。

select DEPARTMENT_ID, DEPARTMENT_NAME from DEPARTMENTS where DEPARTMENT_ID != all(
    select ISNULL(DEPARTMENT_ID,'') from EMPLOYEES where HIRE_DATE like '%2015%'
)

3. 小结

在使用NOT IN子句时,若子查询结果集中可能包含空值NULL,则代码存在隐患,要消除这种隐患,应该对子查询结果集中的空值进行处理。

 

附:基于SQL Server的完整实验代码

假设公司ERP系统中有两个表,员工表EMPLOYEES和部门表DEPARTMENTS(如下所示),老板要找出2015年没有招人的部门号和部门名称。请写出查询的SQL语句。

员工表 EMPLOYEES

EMPLOYEE_ID EMPLOYEE_NAME HIRE_DATE DEPARTMENT_ID
170101 Bob 2016-02-02 001
170102 Alice 2015-02-05 003
170103 Tony 2016-03-04 002
170105 Aaron 2016-08-03 002
170107 Rex 2016-10-11 NULL

部门表 DEPARTMENTS

DEPARTMENT_ID DEPARTMENT_NAME MANAGER_ID
001 Administration 170101
002 IT 170103
003 Finance 170102

创建表SQL语句。

CREATE TABLE DEPARTMENTS(
    DEPARTMENT_ID    CHAR(3) PRIMARY KEY,
    DEPARTMENT_NAME VARCHAR(100),
    MANAGER_ID        CHAR(6)
);

CREATE TABLE EMPLOYEES(
    EMPLOYEE_ID        CHAR(6) PRIMARY KEY,
    EMPLOYEE_NAME    VARCHAR(30) NOT NULL,
    HIRE_DATE        DATE,
    DEPARTMENT_ID    CHAR(3),
    FOREIGN KEY(DEPARTMENT_ID) REFERENCES DEPARTMENTS(DEPARTMENT_ID)
);

insert into DEPARTMENTS values('001','Administration','170101');
insert into DEPARTMENTS values('002','IT','170103');
insert into DEPARTMENTS values('003','Finance','170102');


insert into EMPLOYEES values('170101', 'Bob', '2016-03-02', '001');
insert into EMPLOYEES values('170102', 'Alice', '2015-02-05', '003');
insert into EMPLOYEES values('170103', 'Tony', '2016-03-04', '002');
insert into EMPLOYEES values('170105', 'Aaron', '2016-08-03', '002');
insert into EMPLOYEES values('170107', 'Rex', '2016-10-11', NULL);
展开代码

 上述题目,我们很容易产生这样的思路,先在员工表 EMPLOYEES 中找出2015年雇佣的员工所在的部门号,作为一个部门号子集合,然后在部门表 DEPARTMENTS 中找出不在该子集中的部门号和部门ID,即为要查找的结果。于是有了如下查询SQL语句:

select DEPARTMENT_ID, DEPARTMENT_NAME from DEPARTMENTS where DEPARTMENT_ID not in(
    select DEPARTMENT_ID from EMPLOYEES where HIRE_DATE like '%2015%'
)

然而,由于子查询中存在一个空值,所以SQL Server数据库管理系统执行上述语句之后将返回0条结果。而实际上我们可以从上表中看到,2015年没有招人的部门号和部门名称有{001, Administration } 部门,故上面的查询语句存在BUG。

为保证查询出我们期望的结果,这里使用SQL Server的ISNULL函数对子查询中的空值进行处理,处理之后SQL语句为:

select DEPARTMENT_ID, DEPARTMENT_NAME from DEPARTMENTS where DEPARTMENT_ID not in(
    select ISNULL(DEPARTMENT_ID,'') from EMPLOYEES where HIRE_DATE like '%2015%'
)

SQL Server DBMS将返回给我们期望的结果:

DEPARTMENT_ID    DEPARTMENT_NAME
001          Administration
002              IT
posted @ 2017-08-17 18:02  Robothy  阅读(91162)  评论(2编辑  收藏  举报