(转)Spark 算子系列文章
http://lxw1234.com/archives/2015/07/363.htm
Spark算子:RDD基本转换操作(1)–map、flagMap、distinct
Spark算子:RDD创建操作
Spark算子:RDD基本转换操作(2)–coalesce、repartition
Spark算子:RDD基本转换操作(3)–randomSplit、glom
Spark算子:RDD基本转换操作(4)–union、intersection、subtract
Spark算子:RDD基本转换操作(5)–mapPartitions、mapPartitionsWithIndex
Spark算子:RDD基本转换操作(6)–zip、zipPartitions
Spark算子:RDD基本转换操作(7)–zipWithIndex、zipWithUniqueId
Spark算子:统计RDD分区中的元素及数量
Spark算子:RDD键值转换操作(1)–partitionBy、mapValues、flatMapValues
Spark算子:RDD键值转换操作(2)–combineByKey、foldByKey
Spark算子:RDD键值转换操作(3)–groupByKey、reduceByKey、reduceByKeyLocally
Spark算子:RDD键值转换操作(4)–cogroup、join
Spark算子:RDD键值转换操作(5)–leftOuterJoin、rightOuterJoin、subtractByKey
Spark算子:RDD行动Action操作(1)–first、count、reduce、collect
Spark算子:RDD行动Action操作(2)–take、top、takeOrdered
Spark算子:RDD行动Action操作(3)–aggregate、fold、lookup
Spark算子:RDD行动Action操作(4)–countByKey、foreach、foreachPartition、sortBy
Spark算子:RDD行动Action操作(5)–saveAsTextFile、saveAsSequenceFile、saveAsObjectFile
Spark算子:RDD行动Action操作(6)–saveAsHadoopFile、saveAsHadoopDataset
Spark算子:RDD行动Action操作(7)–saveAsNewAPIHadoopFile、saveAsNewAPIHadoopDataset