会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
两点黑眼圈
博客园
首页
新随笔
联系
订阅
管理
2022年7月13日
hive常见知识点
摘要: 1. Hive 表关联查询,如何解决数据倾斜的问题 1) 倾斜原因: map 输出数据按key Hash 的分配到reduce 中,由于key 分布不均匀、业务数据本身的特、建表时考虑不周、等原因造成的reduce 上的数据量差异过大。 (1) key 分布不均匀; (2) 业务数据本身的特性; (
阅读全文
posted @ 2022-07-13 22:00 景、
阅读(259)
评论(0)
推荐(0)
编辑
公告