SQL group by的困惑

今天为写一条SQL困扰了很久

首先先贴两条sql，大家看看有啥区别

select * from all_txt A where id=(SELECT id from all_txt

where A.key_value = key_value ORDER BY release_time DESC limit 1);

select * from (select *,max(release_time) as timea

from all_txt group by key_value order by release_time desc) a order by timea desc;

然后说明下表的重要字段为三个id,key_value,release_time
作用是取每个相同key_value中release_time最新的数据

所有的数据为

id  key_value release_time
1    001    2007-11-01
2    001    2007-11-02
3    001    2007-11-03
4    002    2007-11-04
5    002    2007-11-05
6    003    2007-11-06
7    004    2007-11-07
8    004    2007-11-08
9    005    2007-11-09
10   005    2007-11-10

现在要的结果为

id  key_value release_time
3    001    2007-11-03
5    002    2007-11-05
6    003    2007-11-06
8    004    2007-11-08
10   005    2007-11-10

针对这些数据，显示貌似都一样
但仔细研究下来就会发现
第二句返回的会是

id  key_value timea     release_time
3    001    2007-11-03  2007-11-01
5    002    2007-11-05  2007-11-04
6    003    2007-11-06  2007-11-06
8    004    2007-11-08  2007-11-07
10   005    2007-11-10  2007-11-09

用max求出来的数据timea是没错，是上面的release_time，但真实的release_time却是不一样的，那证明取的数据不是最新的那条的，而是给我感觉取的是物理位置上的第一条，这样的话如果你还需要这张表的其他字段就会有问题。
说了半天有人会说，那你就用第一种吧，执行下你就会发现，性能太差了，而第二种就很快，本以为能用第二种的，哎~~~~可能是对group by的本质还是了解不是很透彻
大家有啥更好的优化意见或方法，可以给我留言或加入qq群:47833489 讨论

posted on 2012-01-07 22:20 木鱼哥阅读(112) 评论(0) 编辑收藏举报

刷新页面返回顶部

木鱼哥

SQL group by的困惑

导航

公告