hive分组排序函数 分组取top10
hive分组排序函数 分组取top10
语法:row_number() over( partition by 字段a order by 计算项b desc) rank
--这里rank是别名
Partition by:类似hive的建表,分区的意思
这里按字段a分区,对计算项b进行降序排序
实例:
要取top10品牌,各品牌的top10渠道,各品牌的top10渠道中各渠道的top10档期
1) 取top10品牌
Select 品牌,count/sum/其他() as num from tb_name order by num limit 10;
2) 取top10品牌下各品牌的top10渠道
Select a.* from(
Select 品牌,渠道,count/sum/其他() as num, row_number() over(partition by 品牌,order by num desc) rank
From tb_name
Where 品牌限制条件
Group by 品牌,渠道
)a
Where a.rank<=10;
3) 取top10品牌下各品牌的top10渠道中各渠道的top10档期
Select a.* from(
Select 品牌,渠道,档期,count/sum/其他() as num, row_number() over(partition by 品牌,渠道,order by num desc) rank
From tb_name
Where 品牌,渠道 限制条件
Group by 品牌,渠道,档期
)a
Where a.rank<=10;