摘要: 转自:http://my.oschina.net/leejun2005/blog/100922最近几次被问到关于数据倾斜的问题,这里找了些资料也结合一些自己的理解. 在并行计算中我们总希望分配的每一个task 都能以差不多的粒度来切分并且完成时间相差不大,但是集群中可能硬件不同,应用的类型不同和切分... 阅读全文
posted @ 2015-12-06 15:52 五三中 阅读(660) 评论(0) 推荐(0) 编辑