2017年5月18日

Hive 优化

摘要: 一、Hadoop 计算框架的特性 1、什么是数据倾斜? •由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点。 2、Hadoop框架的特性 •不怕数据大,怕数据倾斜。 •jobs数比较多的作业运行效率相对比较低,如子查询比较多。 •sum,count,max,min等聚集函数,不会有数据倾斜 阅读全文

posted @ 2017-05-18 15:55 大大的橙子 阅读(285) 评论(0) 推荐(0) 编辑

导航