摘要: 一、RDD 的创建 1)通过 RDD 的集合数据结构,创建 RDD sc.parallelize(List(1,2,3),2) 其中第二个参数代表的是整个数据,分为 2 个 partition,默认情况会讲数据集进行平分,注意不是两个副本 2)通过文件来读取 sc.textFile("file.tx 阅读全文
posted @ 2018-02-27 13:20 oftenlin 阅读(280) 评论(0) 推荐(0) 编辑