摘要: 1. 文本输出TextOutputFormat 默认的输出格式,把每条记录写为文本行 默认分隔符定义是:\t 即 key\tvalue 将最终输出的key、value数据以指定的分隔符(默认是\t)将key value拼接,然后以字符串(普通的文本数据)写出到结果文件中 分隔符可以自定义: conf 阅读全文
posted @ 2022-07-30 18:08 jsqup 阅读(95) 评论(0) 推荐(0) 编辑
摘要: 定义: 继承Reducer类,Combiner就是一个Reducer,但是处理的是某一个map的输出数据 数据写出到reducer了 job.setCombinerClass(WCCombiner.class); // 输入类型是map阶段的输出类型,输出类型一般是map阶段的输出类型 class 阅读全文
posted @ 2022-07-30 14:49 jsqup 阅读(17) 评论(0) 推荐(0) 编辑