OutputFormat数据输出

一、基础知识

OutputFormat是MapReduce输出的基类,所有实现MapReduce输出都实现了OutputFormat接口

二、常见的OutputFormat实现类

1、TextOutputFormat

默认的输出格式是TextOutputFormat,它把每条记录写在文本行。

它的键和值可以是任意类型,因为TextOutputFormat调用toString()方法可以把他们转换成字符串

2、SequenceFileOutputFormat

将SequenceFileOutputFormat输出作为后续 MapReduce任务的输入,这便是一种好的输出格式。

因为它的格式紧凑,很容易压缩

3、自定义OutputFormat

根据用户需求,自定义实现输出

 三、自定义OutputFormat

1、自定义一个继承FileOutputFormat

2、改写RecordWriter,具体改写输出数据的方法write()

 

posted @ 2020-09-08 12:57  市丸银  阅读(398)  评论(0编辑  收藏  举报