摘要: 键值对RDD通常用来进行聚合计算,Spark为包含键值对类型的RDD提供了一些专有的操作。这些RDD被称为pair RDD。pair RDD提供了并行操作各个键或跨节点重新进行数据分组的操作接口。 Spark中创建pair RDD的方法:存储键值对的数据格式会在读取时直接返回由其键值对数据组成的pa 阅读全文
posted @ 2017-09-15 11:04 Easen.Cai 阅读(1057) 评论(0) 推荐(0) 编辑