摘要: 本文参考:http://www.cnblogs.com/cenyuhai/p/3826227.html在数据流动的整个过程中,最复杂最影响性能的环节,就是 Shuffle 过程,本文将参考大神的博客,根据 Spark-1.5 的代码,再次走读一遍。Shuffle 过程Spark 中最经典的 Shuf... 阅读全文
posted @ 2015-10-12 09:51 徐软件 阅读(332) 评论(0) 推荐(0) 编辑