摘要:
(1)执行hadoopFile()操作,其中有生成HadoopRDD的new 方法。然后执行map方法。pair => pair._2.toString,只对Value值进行操作。在textFile操作中首先从文件系统中读取分布式数据,并且以数据分片的方式存在于集群之中,生成HadoopRDD,的类 阅读全文
摘要:
(1)执行hadoopFile()操作,其中有生成HadoopRDD的new 方法。然后执行map方法。pair => pair._2.toString,只对Value值进行操作。在textFile操作中首先从文件系统中读取分布式数据,并且以数据分片的方式存在于集群之中,生成HadoopRDD,的类 阅读全文
|