Hive笔记01

hive如何实现两个区域人均利润一样的时候，排名一样，出现1、2、2、3、4，这种重复排名的情况？

方案一

在Hive中，可以使用窗口函数和排名函数来实现重复排名的情况。具体步骤如下：

使用窗口函数计算每个区域的人均利润，并按照人均利润降序排列。

使用排名函数对每个区域的人均利润进行排名，生成排名列。

使用窗口函数计算每个排名列中出现的排名数，生成排名计数列。

将排名列和排名计数列合并，生成最终的排名列。

下面是一个示例代码：
```
SELECT region, profit_per_person, 
       RANK() OVER (PARTITION BY region ORDER BY profit_per_person DESC) AS rank,
       COUNT(*) OVER (PARTITION BY region, profit_per_person) AS rank_count
FROM your_table
ORDER BY rank;
```
在这个示例中，your_table是包含区域、人均利润等信息的表。首先，使用窗口函数和排名函数计算每个区域的人均利润和排名。然后，使用窗口函数和聚合函数计算每个排名列中出现的排名数。最后，将排名列和排名计数列合并，生成最终的排名列。

方案二

dense_rank() 函数

SELECT region, profit_per_person, 
       dense_rank() OVER (PARTITION BY region ORDER BY profit_per_person DESC) AS rank
FROM your_table
ORDER BY rank;

mysql如何实现两个区域人均利润一样的时候，排名一样，出现1、2、2、3、4，这种重复排名的情况？

在MySQL中，可以使用变量来实现排名并处理重复排名的情况。以下是一个示例查询：

SELECT
  @rank := IF(@prev_profit = profit, @rank, @rank + @ties) AS rank,
  @ties := IF(@prev_profit = profit, @ties + 1, 1) AS ties,
  @prev_profit := profit AS profit,
  region,
  AVG(profit) AS avg_profit
FROM
  your_table,
  (SELECT @rank := 0, @ties := 1, @prev_profit := NULL) AS vars
GROUP BY
  region
ORDER BY
  avg_profit DESC;

在这个查询中，我们使用了三个变量：@rank、@ties和@prev_profit。@rank表示当前排名，@ties表示当前排名的重复次数，@prev_profit表示上一个区域的利润。我们首先将这些变量初始化为0、1和NULL。

然后，我们使用IF函数来判断当前区域的利润是否与上一个区域的利润相同。如果相同，则将@ties加1，表示当前排名的重复次数增加了一次；否则，将@ties重置为1，并将@rank加上@ties，表示当前排名为上一个排名加上重复次数。

最后，我们按照平均利润降序排序，以获得排名结果。

这样，当两个区域的人均利润相同时，它们将获得相同的排名，并且下一个区域的排名将跳过相同数量的排名。例如，如果有两个区域的人均利润为100，它们将获得排名1和2，下一个区域将获得排名3，而不是2。

posted @ 2023-08-13 21:59 TY520 阅读(13) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Python Pandas 数据分组

· 基因法分库分表

· MySQL 排名函数

· Hive Sql 的三种分组排序

· hive中row_number() rank() dense_rank()的用法

取法其上，得乎其中

伸手摘星，即便一无所获，也不至于满手污泥

Hive笔记01

hive如何实现两个区域人均利润一样的时候，排名一样，出现1、2、2、3、4，这种重复排名的情况？

mysql如何实现两个区域人均利润一样的时候，排名一样，出现1、2、2、3、4，这种重复排名的情况？

公告

最新随笔

积分与排名

随笔分类 (124)

阅读排行榜