摘要: 1. Hive 表关联查询,如何解决数据倾斜的问题 1) 倾斜原因: map 输出数据按key Hash 的分配到reduce 中,由于key 分布不均匀、业务数据本身的特、建表时考虑不周、等原因造成的reduce 上的数据量差异过大。 (1) key 分布不均匀; (2) 业务数据本身的特性; ( 阅读全文
posted @ 2022-07-13 22:00 景、 阅读(259) 评论(0) 推荐(0) 编辑