Hive row_number() 等用法
1、row_number() over()排序功能:
(1) row_number() over()分组排序功能:
在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where group by order by 的执行。
partition by 用于给结果集分组,如果没有指定那么它把整个结果集作为一个分组,它和聚合函数不同的地方在于它能够返回一个分组中的多条记录,而聚合函数一般只有一个反映统计值的记录。
例如:employee,根据部门分组排序。
1 2 3 4 5 6 7 8 9 10 | <strong> SELECT empno,WORKDEPT,SALARY, Row_Number() OVER (partition by workdept ORDER BY salary desc ) rank FROM employee</strong> -------------------------------------- A00 152750 1 A00 66500 2 A00 49250 3 A00 46500 4 A00 39250 5 B01 94250 1 C01 98250 1 C01 73800 2 |
(2)对查询结果进行排序:(无分组)
1 2 3 4 5 6 7 8 9 10 11 | <strong> SELECT empno,WORKDEPT,SALARY, Row_Number() OVER ( ORDER BY salary desc ) rank FROM employee </strong> -------------------------------------- A00 152750 1 C01 98250 2 D21 96170 3 B01 94250 4 E11 89750 5 E21 86150 6 E01 80175 7 C01 73800 8 D11 72250 9 |
row_number() over()和rownum差不多,功能更强一点(可以在各个分组内从1开时排序).
2、rank() over()是跳跃排序,有两个第二名时接下来就是第四名(同样是在各个分组内).
1 2 3 4 5 6 7 8 9 10 11 | <strong> select workdept,salary,rank() over(partition by workdept order by salary) as dense_rank_order from emp order by workdept; </strong> ------------------ A00 39250 1 A00 46500 2 A00 49250 3 A00 66500 4 A00 152750 5 B01 94250 1 C01 68420 1 C01 68420 1 C01 73800 3 |
3、dense_rank() over()是连续排序,有两个第二名时仍然跟着第三名。相比之下row_number是没有重复值的 .
1 2 3 4 5 6 7 8 9 10 11 12 | <strong> select workdept,salary,dense_rank() over(partition by workdept order by salary) as dense_rank_order from emp order by workdept;</strong> ------------------ A00 39250 1 A00 46500 2 A00 49250 3 A00 66500 4 A00 152750 5 B01 94250 1 C01 68420 1 C01 68420 1 C01 73800 2 C01 98250 3 |
使用ROW_NUMBER删除重复数据
---假设表TAB中有a,b,c三列,可以使用下列语句删除a,b,c都相同的重复行。
1 2 | DELETE FROM ( select year ,QUARTER,RESULTS,row_number() over(partition by YEAR ,QUARTER,RESULTS order by YEAR ,QUARTER,RESULTS) AS ROW_NO FROM SALE ) WHERE ROW_NO>1 |
最后在执行hive 语句时出错, 出现错误:
FAILED: ParseException line 22:7 extraneous input '10' expecting EOF near ''
有看到解释说是,原因是:
sql语句中多了分号。。。
执行脚本时需要在sql后面添加分号,但是调用jdbc执行sql语句时,不可以在语句用分号结束。
但依旧没有解决问题。
转自:https://www.cnblogs.com/alsf/p/6344197.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
2017-07-05 Lintcode---区间求和 I
2017-07-05 Lintcode---区间最小数