MySQL COUNT(*) & COUNT(1) & COUNT(col) 比较分析

在面试的时候我们会经常遇到这个问题：

MySQL 中，COUNT(*)、COUNT(1)、COUNT(col) 有区别吗？

有区别。

接下来我们分析一下这三者有什么样的区别。

一、SQL Syntax & Semantics

从语义角度看，它们有不同的含义。

COUNT(expr)返回查询到的行中 expr is not-NULL 的个数，返回类型为 BIGINT（8 bytes）。

Returns a count of the number of non-NULL values of expr in the rows retrieved by a SELECT statement. The result is a BIGINT value.

COUNT(*) 有点不同，它返回查询到的结果集中的行的个数，不论这些行是否含有 NULL 值。

COUNT(*) is somewhat different in that it returns a count of the number of rows retrieved, whether or not they contain NULL values.

COUNT(1) 返回查询到的行中第一列 not NULL 的个数。

COUNT(col) 返回查询到的行中 col 列中 not NULL 的个数。

在 MySQL 中讨论查询性能时，我们需要区分存储引擎。

不同的存储引擎以不同的方式存储数据，这决定了最终的操作效率。

MyISAM 的主键、辅助索引都是非聚簇索引，B+树的叶节点包含的是数据的地址。

InnoDB 的主键是聚簇索引，叶节点存放的是数据本身；辅助索引是非聚簇索引，叶节点存放的是主键。

MyISAM 为每张表存储了一个准确（exact）的 row count。

因此，MyISAM 可以为 COUNT(*) 提供查询优化：当某个 SELECT 语句仅仅查询一张表、不查询其他列、没有查询条件（WHERE 子句）时，COUNT(*) 可以很快地返回这个 row count（e.g. SELECT COUNT(*) FROM tbl_name）。

当第一列定义为 NOT NULL 时，COUNT(1) 和 COUNT(*) 具有相同的查询性能。

InnoDB 是一款 transactional 存储引擎。

可能有多个事务并发操作一张表，所以 InnoDB 无法为每张表存储一个准确的 row count（因为不同的 transaction 可能会看到不同的 row count，row count 很难准确）。

对于 InnoDB 而言，COUNT(*)、 COUNT(1) 没有性能上的差异。

COUNT(*) 会利用索引：在 MySQL 5.7.18 之前，会利用聚簇索引；在 MySQL 5.7.18 之后，会利用一个最小的辅助索引（有的话）。

posted @ 2018-04-16 10:06 赫尔修斯阅读(915) 评论(0) 收藏举报

刷新页面返回顶部