Hadoop InputFormat OutputFormat
摘要:
InputFormat有两个抽象方法:
getSplits createRecordReader InputSplits 将数据按照Split进行切分,一个Split分给一个task执行。
RecordReader 在Task中将Split按照key value进行切分,每个RecordReader切分的数据都给map方法执行一遍。 RecordReader三个抽象方法:
ini... 阅读全文
posted @ 2013-12-25 16:56 萌@宇 阅读(250) 评论(0) 推荐(0) 编辑