不再迷惑,无值和NULL值

在关系型数据库的世界中,无值和NULL值的区别是什么?一直被这个问题困扰着,甚至在写TSQL脚本时,战战兢兢,如履薄冰,害怕因为自己的一知半解,挖了坑,贻害后来人,于是,本着上下求索,不达通幽不罢休的决心(开个玩笑),遂有此文。

学习过关系型数据库的伙伴都知道,NULL是指不确定的值,在数据库中绝对是噩梦的存在;而空值,一般对字符串类型而言,指没有任何值的字符串类型,为字符类型的变量设置为空值:set @vs='',空值跟无值不同。有人可能会问,无值是什么?无值,是指数据表中没有任何数据。无值和不确定值,单从字面意思上来看,两者之间的定义很清楚,一旦深究,这两者之间的关系,有时令人十分迷惑(confused),这是因为,在特定条件下,无值会转换为NULL值。

一,举个栗子,理解无值和NULL值的区别

比如,创建一个临时表,在不插入任何数据时,该数据表是空的,没有任何值,对其执行select命令,将不会返回任何数据值:

create table #temp
(
id int null
)

创建一个标量类型的变量,在不初始化时,该变量的值是不确定的,其值是NULL:

declare @vs int

创建一个表类型变量,在不初始化时,该表变量没有任何数据,是无值的:

declare @vt as table
(
id int null
)

总结一下,声明一个标量型变量,如果没有对变量进行初始化,其值是不确定的,是NULL值;对于表变量,临时表和基础表,如果没有插入任何数据,该表没有任何数据,是无值的。

二,无值和NULL值的转换

在开始本节之前,先为变量赋值,简单的一个select命令就可以完成变量的赋值:

select @vs=1

有些朋友思维比较活跃,立马会想到:“用select命令可以从表中取值为变量赋值”,对,但是,赋值方法不是我求索的重点,我关注的是从表中取值为变量赋值的结果。

1,从空表中为变量赋值

如果数据表是空表,没有任何值,那么数据库引擎不会执行赋值语句,变量保持原有值不变:

select @vs=id
from #temp

但是,如果采用以下方式,那么数据库引擎会执行赋值语句,由于空表不返回任何值,数据库引擎会把无值转换为不确定值NULL:

select @vs=(select top 1 id
from #temp)

诧异吗?无值和NULL值的转换,居然从不起眼的变量赋值开始。注意,当不返回任何值时,数据库引擎不确定返回值,就把无值转换为NULL值。

2,从空表中计算聚合

空表是没有任何数据的表,计算聚合会产生怎样的结果?

select count(0) as count_all
    ,count(id) as count_id
    ,max(id) as max_id
    ,min(id) as min_id
    ,avg(id) as avg_id
    ,sum(id) as sum_id
from #temp

当统计数据行数时,返回的是0;当计算聚合函数(max,min,avg和sum)的聚合值时,由于无值可以聚合,数据库引擎不能确定这些聚合函数的返回值,因此,数据库引擎返回NULL值。

三,聚合函数忽略NULL值 

一般情况下,除了count(0),count(*)之外,聚合函数都会忽略NULL值,而统计非NULL值,如果读者有疑问,可以查看我的博客《TSQL 聚合函数忽略NULL值》。如果只知聚合函数忽略NULL值,而不知空表也会产生结果为NULL的聚合值,轻易得出聚合函数不会返回NULL值的定论,那就很尴尬。楼主曾遇到过一次“意外”,在一次调试脚本代码的过程中,我遇到max聚合函数返回NULL值的情况,当时一脸懵逼,直接怀疑自己之前的所学。

当聚合列值都是NULL值时,由于聚合函数忽略NULL值,因此,当计算聚合函数(max,min,avg和sum)的聚合值时,由于无值可以聚合,数据库引擎不能确定这些聚合函数的返回值,因此,数据库引擎返回NULL值。

insert into #temp(id)
values(null)

select count(0) as count_all
    ,count(id) as count_id
    ,max(id) as max_id
    ,min(id) as min_id
    ,avg(id) as avg_id
    ,sum(id) as sum_id
from #temp

聚合函数(max,min,sum,avg和count)忽略null值,但不代表聚合函数不返回null值:如果数据表为空表,或聚合列值都是null,那么max,min,sum,avg聚合函数返回null值,而count 聚合函数返回0。聚合函数的共性:Null values are ignored。

 

 不再迷惑:当不返回任何值时,数据库引擎不确定返回值,就把无值转换为NULL值。

 

附:select和set通过查询(query)对变量赋值的差异:

差异1:set 只能对变量赋值一次,而select 可以对变量赋值多次,变量值是最后一次赋值的结果

set @variable=(select top 1 column_name from data_table)

select @variable=column_name
from data_table

差异2:如果查询(query)不返回任何值,set把变量的值设置为NULL,而select将不会执行赋值操作,变量保持原来的值不变

--if query returns no value, assign variable null
set/select @variable=(select top 1 column_name from data_table)

--if query returns no value , the variable keeps previous value
select @variable=column_name
from data_table

代码中,查询(query)返回标量值,使用set和select对变量赋值,变量的值都是NULL

 

posted @ 2017-06-20 11:39  悦光阴  阅读(5027)  评论(4编辑  收藏  举报