摘要: 一、Spark Core 1. 什么是Spark Shuffle Wide Dependencies *ByKey: groupByKey,reduceByKey 关联操作:join,cogroup 窄依赖: 父RDD的每个分区的数据,仅仅只会给子RDD的一个分区。 Spark性能优化: 开发优化: 阅读全文
posted @ 2016-10-22 12:12 沙漏哟 阅读(194) 评论(0) 推荐(0) 编辑