摘要: Hive中的数据倾斜 hive 1. 什么是数据倾斜 mapreduce中,相同key的value都给一个reduce,如果个别key的数据过多,而其他key的较少,就会出现数据倾斜。通俗的说,就是我们在处理的时候数据分布的不均,导致了数据大量集中在某一点。造成了数据的热点。 其实在mapreduc 阅读全文
posted @ 2016-03-27 11:59 Raymoc 阅读(5413) 评论(1) 推荐(1) 编辑