摘要: 先来看一下在PairRDDFunctions.scala文件中reduceByKey和groupByKey的源码 通过源码可以发现: reduceByKey:reduceByKey会在结果发送至reducer之前会对每个mapper在本地进行merge,有点类似于在MapReduce中的combin 阅读全文
posted @ 2017-10-04 10:53 0xcafedaddy 阅读(7708) 评论(0) 推荐(0) 编辑