mysql分组和排序同时使用时查询数据异常

引自: https://blog.csdn.net/iiopsd/article/details/119572410

 

问题背景:

每个地点每天新增一条数据,要根据地点分组查询出每个设备最新的数据(按创建时间倒序)。

数据库结构:

CREATE TABLE `ecord` (
  `Id` varchar(32) NOT NULL COMMENT 'Id',
  `Addr_Id` varchar(32) DEFAULT NULL COMMENT '地址Id',
  `Create_Time` datetime DEFAULT NULL COMMENT '创建时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

一般思路:

SELECT *
FROM record
GROUP BY Addr_Id
ORDER BY Create_Time DESC;

这样查询会发现查询出来的数据并不是最新的,没有得到我们需要的结果,这是因为group by 和 order by 一起使用时,会先使用group by 分组,并取出分组后的第一条数据,所以后面的order by 排序时根据取出来的第一条数据来排序的,但是第一条数据不一定是分组里面的最新的数据。

解决方案:
方案一:
使用子查询,先排序查出结果后作为临时表在分组。这里有个坑,必须要加limit,如果没有加,有些版本的数据库也无法查处正确数据。个人测试:mysql 5.6.19可以查询到正确的数据,mysql 5.7.28无法查询到正确的数据。如果数据太多加上limit可能会导致一些数据丢失,例如limit 100,却又1000个地点,就会丢失900个。

SELECT
    * 
FROM
    ( 
     SELECT * FROM Record 
     ORDER BY Create_Time DESC 
     LIMIT 100
      ) t 
GROUP BY
    addrId;

方案二:

可以根据时间排序,然后根据地址给数据加上排序编号。然后找出排序等于1的就可以。因为要遍历所有数据并排序,所以查询效率低。

addrId    createTime    rank
H1        2021-8-5    1
H2        2021-8-5    1
H3        2021-8-5    1
H1        2021-8-4    2
H2        2021-8-4    2
H1        2021-8-3    3

// 根据addrId 编号
SELECT @num := IF(@str = a.addr_Id , @num + 1, 1) RANK,
    @str := a.addr_Id ,
    a.*
FROM record a, (SELECT @str := '', @num := 0) t2
ORDER BY a.Create_Time DESC;

// 完整的sql:
SELECT *
FROM (
         SELECT @num := IF(@str = a.addr_Id, @num + 1, 1) RANK,
            @str := a.addr_Id ,
            a.*
         FROM record a, (SELECT @str := '', @num := 0) t
         ORDER BY a.Create_Time DESC
    ) x
WHERE RANK = 1;

方案三:

使用Max()函数,根据地址分组查出每个地址最新数据的时间,然后将查询结果关联原表查出正确的数据。当前场景个人选择这个方案解决。

SELECT
    b.*
FROM
    ( 
         SELECT Addr_Id addrId, Max(Create_Time) creatTime 
         FROM Record 
         GROUP BY addrId 
   ) a
LEFT JOIN record b ON a.creatTime = b.Create_Time 
AND a.addrId = b.Addr_Id 

 

posted @ 2022-07-26 14:47  study_php_java_C++  阅读(364)  评论(1编辑  收藏  举报