2013年12月25日

Hadoop InputFormat OutputFormat

摘要: InputFormat有两个抽象方法: getSplits createRecordReader InputSplits 将数据按照Split进行切分,一个Split分给一个task执行。 RecordReader 在Task中将Split按照key value进行切分,每个RecordReader切分的数据都给map方法执行一遍。 RecordReader三个抽象方法: ini... 阅读全文

posted @ 2013-12-25 16:56 萌@宇 阅读(250) 评论(0) 推荐(0) 编辑

导航