用优雅的办法实现hive中求同比环比

一般在hive中求同比环比都需要表自关联,其实还有一种更优雅的办法。

hive中有个lag函数,正好可以用于求同比环比,不过要求数据比较完整

LAG(col,n,DEFAULT) 用于统计窗口内往上第n行值

第一个参数为列名,
第二个参数为往上第n行(可选,默认为1),
第三个参数为默认值(当往上第n行为NULL时候,取默认值,如不指定,则为NULL)

num1即为上个月的值,num2即为12个月之前的值

复制代码
select year_id,month_id,num,
lag(num,1,0) over (order by year_id,month_id) num1,
lag(num,12,0) over (order by year_id,month_id) num2,
num/(lag(num,1,0) over (order by year_id,month_id))-1 as num3,
num/(lag(num,12,0) over (order by year_id,month_id))-1 as num4
from 
(select year_id,
month_id,
count(distinct prem_id) as num
from cisadm_dwd.dwd_cis_wo_repair_di
group by year_id,month_id
order by  year_id,month_id)a
复制代码

 

posted @   Mars.wang  阅读(2520)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 通过 API 将Deepseek响应流式内容输出到前端
点击右上角即可分享
微信分享提示