mysql分组和排序同时使用时查询数据异常

引自: https://blog.csdn.net/iiopsd/article/details/119572410

问题背景：

每个地点每天新增一条数据，要根据地点分组查询出每个设备最新的数据（按创建时间倒序）。

数据库结构：

CREATE TABLE `ecord` (
  `Id` varchar(32) NOT NULL COMMENT 'Id',
  `Addr_Id` varchar(32) DEFAULT NULL COMMENT '地址Id',
  `Create_Time` datetime DEFAULT NULL COMMENT '创建时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

一般思路：

SELECT *
FROM record
GROUP BY Addr_Id
ORDER BY Create_Time DESC;

这样查询会发现查询出来的数据并不是最新的，没有得到我们需要的结果，这是因为group by 和 order by 一起使用时，会先使用group by 分组，并取出分组后的第一条数据，所以后面的order by 排序时根据取出来的第一条数据来排序的，但是第一条数据不一定是分组里面的最新的数据。

解决方案：
方案一：
使用子查询，先排序查出结果后作为临时表在分组。这里有个坑，必须要加limit，如果没有加，有些版本的数据库也无法查处正确数据。个人测试：mysql 5.6.19可以查询到正确的数据，mysql 5.7.28无法查询到正确的数据。如果数据太多加上limit可能会导致一些数据丢失，例如limit 100，却又1000个地点，就会丢失900个。

SELECT
    * 
FROM
    ( 
     SELECT * FROM Record 
     ORDER BY Create_Time DESC 
     LIMIT 100
      ) t 
GROUP BY
    addrId;

方案二：

可以根据时间排序，然后根据地址给数据加上排序编号。然后找出排序等于1的就可以。因为要遍历所有数据并排序，所以查询效率低。

addrId    createTime    rank
H1        2021-8-5    1
H2        2021-8-5    1
H3        2021-8-5    1
H1        2021-8-4    2
H2        2021-8-4    2
H1        2021-8-3    3

// 根据addrId 编号
SELECT @num := IF(@str = a.addr_Id , @num + 1, 1) RANK,
    @str := a.addr_Id ,
    a.*
FROM record a, (SELECT @str := '', @num := 0) t2
ORDER BY a.Create_Time DESC;

// 完整的sql：
SELECT *
FROM (
         SELECT @num := IF(@str = a.addr_Id, @num + 1, 1) RANK,
            @str := a.addr_Id ,
            a.*
         FROM record a, (SELECT @str := '', @num := 0) t
         ORDER BY a.Create_Time DESC
    ) x
WHERE RANK = 1;

方案三：

使用Max()函数，根据地址分组查出每个地址最新数据的时间，然后将查询结果关联原表查出正确的数据。当前场景个人选择这个方案解决。

SELECT
    b.*
FROM
    ( 
         SELECT Addr_Id addrId, Max(Create_Time) creatTime 
         FROM Record 
         GROUP BY addrId 
   ) a
LEFT JOIN record b ON a.creatTime = b.Create_Time 
AND a.addrId = b.Addr_Id

posted @ 2022-07-26 14:47 study_php_java_C++ 阅读(405) 评论(1) 收藏举报

刷新页面返回顶部

study_php_java_C++

mysql分组和排序同时使用时查询数据异常

问题背景：

一般思路：

方案二：

方案三：

公告