摘要: 一、输入格式 (1)输入分片记录 ①JobClient通过指定的输入文件的格式来生成数据分片InputSplit; ②一个分片不是数据本身,而是可分片数据的引用; ③InputFormat接口负责生成分片; 源码位置:org.apache.hadoop.mapreduce.lib.input包(新) 阅读全文
posted @ 2016-10-13 22:48 dy9776 阅读(3022) 评论(0) 推荐(0) 编辑