Select count(*)和Count（1）的区别和执行方式

在SQL Server中Count(*)或者Count(1)或者Count([列])或许是最常用的聚合函数。很多人其实对这三者之间是区分不清的。本文会阐述这三者的作用，关系以及背后的原理。

往常我经常会看到一些所谓的优化建议不使用Count(* )而是使用Count（1），从而可以提升性能，给出的理由是Count( *)会带来全表扫描。而实际上如何写Count并没有区别。

Count(1)和Count(*)实际上的意思是，评估Count（）中的表达式是否为NULL，如果为NULL则不计数，而非NULL则会计数。比如我们看代码1所示，在Count中指定NULL（优化器不允许显式指定NULL，因此需要赋值给变量才能指定）。

DECLARE @xx INT

SET @xx=NULL

SELECT COUNT(@xx) FROM [AdventureWorks2012].[Sales].[SalesOrderHeader]

代码清单1.Count中指定NULL

由于所有行都为NULL，则结果全不计数为0，结果如图1所示。

图1.显而易见，结果为0

因此当你指定Count(*）或者Count（1）或者无论Count(‘anything’)时结果都会一样，因为这些值都不为NULL，如图2所示。

图2.只要在Count中指定非NULL表达式，结果没有任何区别

那Count列呢？

对于Count（列）来说，同样适用于上面规则，评估列中每一行的值是否为NULL，如果为NULL则不计数，不为NULL则计数。因此Count（列）会计算列或这列的组合不为空的计数。

那Count（*）具体如何执行？

前面提到Count( )有不为NULL的值时，在SQL Server中只需要找出具体表中不为NULL的行数即可，也就是所有行（如果一行值全为NULL则该行相当于不存在）。那么最简单的执行办法是找一列NOT NULL的列，如果该列有索引，则使用该索引，当然，为了性能，SQL Server会选择最窄的索引以减少IO。

我们在Adventureworks2012示例数据库的[Person].[Address]表上删除所有的非聚集索引，在ModifyDate这个数据类型为DateTime的列上建立索引，我们看执行计划，如图3所示：

图3.使用了CreateDate的索引

我们继续在StateProvinceID列上建立索引，该列为INT列，占4字节，相比之前8字节 DateTime类型的列更短，因此SQL Server选择了StateProvinceID索引。如图4所示。

图4.选择了更短的StateProvinceID索引

结论是：如果该表只有一个主键索引，没有任何二级索引的情况下，那么COUNT(*)和COUNT(1)都是通过通过主键索引来统计行数的。如果该表有二级索引，则COUNT(1)和COUNT(*)都会通过占用空间最小的字段的二级索引进行统计，

这里统计行数的操作，查询优化器的优化方向就是选择能够让IO次数最少的索引，也就是基于占用空间最小的字段所建的索引（每次IO读取的数据量是固定的，索引占用的空间越小所需的IO次数也就越少）。而Innodb的主键索引是聚簇索引（包含了KEY，除了KEY之外的其他字段值，事务ID和MVCC回滚指针）所以主键索引一定会比二级索引（包含KEY和对应的主键ID）大，也就是说在有二级索引的情况下，一般COUNT()都不会通过主键索引来统计行数，在有多个二级索引的情况下选择占用空间最小的。

因此，如果某个表上Count（*)用的比较多时，考虑在一个最短的列建立一个单列索引，会极大的提升性能。

在SQL语句中count函数是最常用的函数之一，count函数是用来统计表中记录数的一个函数，

一. count(1)和count(*)的区别

1. count(1)和count(*)的作用：

都是检索表中所有记录行的数目，不论其是否包含null值。

2. 区别：但是count(1)比count(*)效率更高

二 . count(字段)与count(1)和count(*)的区别

count(字段)的作用是检索表中的这个字段的非空行数，不统计这个字段值为null的记录

posted @ 2019-02-26 13:52 zhangniuniu 阅读(8766) 评论(0) 收藏举报

刷新页面返回顶部

zhangniuniu

Select count(*)和Count（1）的区别和执行方式

那Count列呢？

那Count（*）具体如何执行？

公告