textFile

testFile可以接受一个HDFS文件,可以是一个本地系统的文件,或者是任意hadoop支持的文件系统的URI,返回一个RDD[String]

 

1.调用hadoopFile,生成一个HadoopRDD

 

2.将HadoopRdd的key省去,只留value,生成一个mapPartitionRDD

 

一般从textfile读取数据形成hadooprdd,其RDD划分的计算partition等于这个文件的block数

posted on 2016-07-05 15:44  杰克再造  阅读(174)  评论(0编辑  收藏  举报

导航