RDD/Dataset/DataFrame互转

1.RDD -> Dataset
val ds = rdd.toDS()

2.RDD -> DataFrame
val df = spark.read.json(rdd)

3.Dataset -> RDD
val rdd = ds.rdd

4.Dataset -> DataFrame
val df = ds.toDF()

5.DataFrame -> RDD
val rdd = df.toJSON.rdd

6.DataFrame -> Dataset
val ds = df.toJSON

posted @ 2016-12-14 15:12  ciade  阅读(7442)  评论(0编辑  收藏  举报