摘要: 本文用到的测试数据person.txt lijing 29 guodegang 45 heyunwei 30 yueyunpeng 100 rdd的分区数量,读取hdfs文件,默认是文件个数 rdd生成方式: 1) 并行化 2) 通过读取文件api方法生成 DataFrame的基础操作,详见官方AP 阅读全文
posted @ 2016-06-12 10:25 suinlove 阅读(370) 评论(0) 推荐(0) 编辑