摘要: 创建RDD 方式一:从集合创建RDD makeRDD Parallelize 注意:makeRDD可以指定每个分区perferredLocations参数parallelize则没有。 方式二:读取外部存储创建RDD Spark与Hadoop完全兼容,所以对Hadoop所支持的文件类型或者数据库类型 阅读全文
posted @ 2018-09-18 14:47 子墨言良 阅读(166) 评论(0) 推荐(0) 编辑