摘要: package action; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import o... 阅读全文
posted @ 2019-04-02 11:35 _Meditation 阅读(125) 评论(0) 推荐(0) 编辑
摘要: 在java中,RDD分为javaRDDs和javaPairRDDs。下面分两大类来进行。 都必须要进行的一步。 一。javaRDDs 二。JavaPairRDDs. zip: 最后都要加上 aggregateByKey算子详解 repartitionAndSortWithinPartitions算子 阅读全文
posted @ 2019-04-02 10:44 _Meditation 阅读(198) 评论(0) 推荐(0) 编辑