摘要: RDD.union,和SparkContext.union都可以将多个RDD聚合成一个UnionRDD。 但不同的是,RDD.union在每次操作时,会创建一个新的数据集合,生成新的RDD,新的RDD和原有RDD血统不一致。 SparkContext.union可以将所有需要聚合的RDD,直接生成一 阅读全文
posted @ 2017-06-02 18:17 澄轶 阅读(3269) 评论(0) 推荐(0) 编辑