hive开窗函数详解

1. OVER():用于指定分析函数工作时的数据窗口大小,这个数据窗口大小可能会随着行的变而变化;

2. CURRENT ROW:当前行;

  1. n PRECEDING:往前n行数据;
  2. n FOLLOWING:往后n行数据;
  3. UNBOUNDED:起点,UNBOUNDED PRECEDING 表示从前面的起点, UNBOUNDED FOLLOWING表示到后面的终点;
  4. LAG(col,n,default_val):往前第n行数据;
  5. LEAD(col,n, default_val):往后第n行数据;
  6. NTILE(n):把有序分区中的行分发到指定数据的组中,各个组有编号,编号从1开始,对于每一行,NTILE返回此行所属的组的编号。这个函数需要注意:n必须为int类型。   

以下举几个具体的示例说明其具体作用

1. 当前行和自己下一行的和 

select *,sum(trade_amount) over(order by TRADE_DATE rows between current row and 1 following)
from default.tmp_test

 

 

2  当前行,到第二行的的统计值,就是统计自己行和自己后两行的累计之和

select *,sum(trade_amount) over(order by TRADE_DATE rows between current row and 2 following)
from default.tmp_test

 

3.从当前行一直累加到最后一行

select *,sum(trade_amount) over(partition by trade_type order by TRADE_DATE rows between unbounded preceding and current row)
from default.tmp_test;

 

posted @ 2021-07-06 11:22  欣欣姐  Views(898)  Comments(0Edit  收藏  举报