testFile可以接受一个HDFS文件,可以是一个本地系统的文件,或者是任意hadoop支持的文件系统的URI,返回一个RDD[String]
1.调用hadoopFile,生成一个HadoopRDD
2.将HadoopRdd的key省去,只留value,生成一个mapPartitionRDD
一般从textfile读取数据形成hadooprdd,其RDD划分的计算partition等于这个文件的block数
posted on 2016-07-05 15:44 杰克再造 阅读(174) 评论(0) 编辑 收藏 举报