OutputFormat数据输出
一、基础知识
OutputFormat是MapReduce输出的基类,所有实现MapReduce输出都实现了OutputFormat接口
二、常见的OutputFormat实现类
1、TextOutputFormat
默认的输出格式是TextOutputFormat,它把每条记录写在文本行。
它的键和值可以是任意类型,因为TextOutputFormat调用toString()方法可以把他们转换成字符串
2、SequenceFileOutputFormat
将SequenceFileOutputFormat输出作为后续 MapReduce任务的输入,这便是一种好的输出格式。
因为它的格式紧凑,很容易压缩
3、自定义OutputFormat
根据用户需求,自定义实现输出
三、自定义OutputFormat
1、自定义一个继承FileOutputFormat
2、改写RecordWriter,具体改写输出数据的方法write()