随笔 - 126  文章 - 0  评论 - 5  阅读 - 94759
05 2021 档案
HIVE 大表JOIN大表优化方法
摘要:今天遇到了百亿级别的数据量JOIN 十亿级别的数据量 发现reduce 40分钟还没有出来,进去看单个task 某些task要30min+才能跑完成 阅读全文
posted @ 2021-05-30 15:53 大鹏的鸿鹄之志 阅读(903) 评论(0) 推荐(0) 编辑
取排名前50%的数据
摘要:1 SELECT 2 goods_id, 3 mall_id, 4 gmv 5 FROM( 6 SELECT 7 goods_id, 8 mall_id, 9 gmv, 10 dense_rank() over (partition by mall_id order by gmv desc ) as 阅读全文
posted @ 2021-05-20 21:31 大鹏的鸿鹄之志 阅读(144) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示