摘要: 本文转发自Jason’s Blog,原文链接 http://www.jasongj.com/spark/skew/ 摘要 为何要处理数据倾斜(Data Skew) 什么是数据倾斜 数据倾斜是如何造成的 从数据源直接读取。如读取HDFS,Kafka 读取上一个Stage的Shuffle数据 如何缓解/ 阅读全文
posted @ 2017-03-21 14:49 Syn良子 阅读(18021) 评论(2) 推荐(5) 编辑