MySQL COUNT(*) & COUNT(1) & COUNT(col) 比较分析
在面试的时候我们会经常遇到这个问题:
MySQL 中,COUNT(*)、COUNT(1)、COUNT(col) 有区别吗?
有区别。
接下来我们分析一下这三者有什么样的区别。
一、SQL Syntax & Semantics
从语义角度看,它们有不同的含义。
COUNT(
返回查询到的行中 expr is not-NULL 的个数,返回类型为 BIGINT(8 bytes)。expr
)
Returns a count of the number of non-
NULL
values ofexpr
in the rows retrieved by aSELECT
statement. The result is aBIGINT
value.
COUNT(*) 有点不同,它返回查询到的结果集中的行的个数,不论这些行是否含有 NULL 值。
COUNT(*)
is somewhat different in that it returns a count of the number of rows retrieved, whether or not they containNULL
values.
COUNT(1) 返回查询到的行中第一列 not NULL 的个数。
COUNT(col) 返回查询到的行中 col 列中 not NULL 的个数。
二、查询性能
在 MySQL 中讨论查询性能时,我们需要区分存储引擎。
不同的存储引擎以不同的方式存储数据,这决定了最终的操作效率。
MyISAM 的主键、辅助索引都是非聚簇索引,B+树的叶节点包含的是数据的地址。
InnoDB 的主键是聚簇索引,叶节点存放的是数据本身;辅助索引是非聚簇索引,叶节点存放的是主键。
1、MyISAM
MyISAM 为每张表存储了一个准确(exact)的 row count。
因此,MyISAM 可以为 COUNT(*) 提供查询优化:当某个 SELECT 语句仅仅查询一张表、不查询其他列、没有查询条件(WHERE 子句)时,COUNT(*) 可以很快地返回这个 row count(e.g. SELECT COUNT(*) FROM tbl_name)。
当第一列定义为 NOT NULL 时,COUNT(1) 和 COUNT(*) 具有相同的查询性能。
2、InnoDB
InnoDB 是一款 transactional 存储引擎。
可能有多个事务并发操作一张表,所以 InnoDB 无法为每张表存储一个准确的 row count(因为不同的 transaction 可能会看到不同的 row count,row count 很难准确)。
对于 InnoDB 而言,COUNT(*)、 COUNT(1) 没有性能上的差异。
COUNT(*) 会利用索引:在 MySQL 5.7.18 之前,会利用聚簇索引;在 MySQL 5.7.18 之后,会利用一个最小的辅助索引(有的话)。
三、参考资料:
What is better in MYSQL count(*) or count(1)?