至高吴上(Alfa.wu)

一个人,一生,能坚持做好一件事情是多么的牛XX啊!!!

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
  359 随笔 :: 1 文章 :: 71 评论 :: 145万 阅读

2021年6月4日

 

Mysql 行号+分组行号+取Top记录 SQL

select * from (
                  SELECT (@rowNum := @rowNum + 1)                      as rowNum  -- 全量行号
                       , a.col1

                       , case
                             when @groupItem != a.col1 then @groupRowNum := 1
                             else @groupRowNum := @groupRowNum + 1 end as groupRowNum   -- 根据分组项目,设置分组行号, 分组项目与当前行分组项目不一致时,则分组行号重新置 1 
                       , case
                             when @groupItem != a.col1 then @groupItem := a.col1
                             else round(@groupItem, 0) end             as groupItem    -- 标记分组项目, 为分组行号提供判断依据
                       , col2
                       , num
                  FROM (
                           SELECT  col1 ,  col2, COUNT(*) as num
                           FROM tb_test
                           GROUP BY col1, col2
                       ) a
                           inner join (select @rowNum := 0 as rowNum) t1   -- 全量行号变量 初始化
                           inner join (select @groupRowNum := 0) t2   -- 分组行号变量 初始化
                           inner join (select @groupItem := -1) t3  -- 分组项目变量 初始化
                  where 1 = 1
                  order by a.col1, num desc  -- 分组行号排序条件 
                    limit 100000  -- order by 在子查询中不能行, 需要加 limit 
              ) x
where 1=1
and groupRowNum <=3  -- 增加 分组后 top n 条件
;


 

 


注:

mysql5.7及以上 子查询里面最好不要用order by


官方解释:
在mysql5.7手册的8.2.2.1中有解释:


子查询的优化是使用半连接的策略完成的(The optimizer uses semi-join strategies to improve subquery execution)


使用半连接进行优化,子查询语句必须满足一些标准(In MySQL, a subquery must satisfy these criteria to be handled as a semi-join)。


其中一个标准是:必须不是一个包含了limit和order by的语句(It must not have ORDER BY with LIMIT.)


1.子查询如果同时存在order by和limit,不会忽略order by
此方法查询特别慢,具体原因不知道,最好把order by放在父查询
2.只存在order by 会忽略

因此只适用于平时线下数据分析使用.

 

 

Top 1 

select b.col1, max(b.col2) as col2 , num
from (
         SELECT  col1, col2, COUNT(1) as num
         FROM tb_test
         GROUP BY col1, col2
     ) b

where 1=1and not exists(
              select 1
              from (
                                SELECT col1, col2, COUNT(1) as num
                                FROM tb_test
                                GROUP BY col1, col2
                   ) c
              where 1 = 1
                and b.col1 = c.col1
                and b.num < c.num
          )
group by b.col1, num
order by col1
;

 

 

Top  num N 

注: 如需 TOP N 还需要再 Group 一下

 

select
       a.col1, a.col2, a.num, count(*)
# *
from (
         SELECT  col1,  col2, COUNT(1) as num
         FROM tb_test
         where 1=1GROUP BY col1, col2
     ) a
    left join (

         SELECT col1,  col2, COUNT(1) as num
         FROM tb_test
         where 1=1GROUP BY col1, col2

    ) b
    on a.col1 = b.col2
    and a.num < b.num
    where 1=1
    group by a.col1, a.col2, a.num having count(b.col1) < 2
    order by  a.col1, a.num desc


;

 

posted @ 2021-06-04 09:45 Alfa 阅读(748) 评论(0) 推荐(0) 编辑

2019年5月13日

摘要: 转自: https://www.cnblogs.com/dennyzhangdd/p/6909771.html?utm_source=itdadao&utm_medium=referral 目录 一、抛出问题 二、分析 三、实际应用 四、总结: 目录 一、抛出问题 二、分析 三、实际应用 四、总结: 阅读全文
posted @ 2019-05-13 10:05 Alfa 阅读(732) 评论(0) 推荐(0) 编辑

2019年1月8日

摘要: 摘自网上 阅读全文
posted @ 2019-01-08 10:36 Alfa 阅读(1527) 评论(0) 推荐(0) 编辑

2018年12月19日

摘要: tag是对历史一个提交id的引用,如果理解这句话就明白了使用git checkout tag即可切换到指定tag,例如:git checkout v0.1.0切换到tag历史记录会处在分离头指针状态,这个是的修改是很危险的,在切换回主线时如果没有合并,之前的修改提交基本都会丢失,如果需要修改可以尝试 阅读全文
posted @ 2018-12-19 09:02 Alfa 阅读(508) 评论(0) 推荐(0) 编辑

2018年12月12日

摘要: 摘自: https://blog.csdn.net/zhuzaijava/article/details/77935200 为了验证select 1 与 select 1 from tableName 与 select * from tableName的执行效率,需要测试一下各自执行的时间。于是总结 阅读全文
posted @ 2018-12-12 17:03 Alfa 阅读(4168) 评论(0) 推荐(0) 编辑

摘要: 摘要: https://edu.aliyun.com/a/29036?spm=5176.11182482.related_article.1.hbeZbF 摘要: MYSQL 应该是最流行了 WEB 后端数据库。WEB 开发语言最近发展很快,PHP, Ruby, Python, Java 各有特点, 阅读全文
posted @ 2018-12-12 14:23 Alfa 阅读(528) 评论(0) 推荐(0) 编辑

2018年11月13日

摘要: =LEFT(A1,1)&MID(SUBSTITUTE(PROPER(A1),"_",""),2,100) 阅读全文
posted @ 2018-11-13 21:54 Alfa 阅读(1056) 评论(0) 推荐(0) 编辑

2018年2月5日

摘要: 摘自: https://www.jianshu.com/p/fc23c94fc439 阅读全文
posted @ 2018-02-05 13:41 Alfa 阅读(221) 评论(0) 推荐(0) 编辑

2017年12月12日

摘要: MySQL 3.22限制的表大小为4GB。由于在MySQL 3.23中使用了MyISAM存储引擎,最大表尺寸增加到了65536TB(2567&ndash; 1字节)。由于允许的表尺寸更大,MySQL数据库的最大有效表尺寸通常是由操作系统对文件大小的限制决定的,而不是由MySQL内部限制决定的。 In 阅读全文
posted @ 2017-12-12 09:15 Alfa 阅读(2074) 评论(0) 推荐(0) 编辑

2017年10月18日

摘要: 摘自: http://blog.csdn.net/xiaoyaotan_111/article/details/53817918 一 简介 (1)过滤器: 依赖于servlet容器。在实现上基于函数回调,可以对几乎所有请求进行过滤,但是缺点是一个过滤器实例只能在容器初始化时调用一次。使用过滤器的目的 阅读全文
posted @ 2017-10-18 16:58 Alfa 阅读(4716) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示