摘要:
症状:在Reduce中使用MultipleOutputs根据输入的key输出到某个MultipleOutputs.addNamedOutput()中,程序运行结束却没有对应的输出文件。解决:在Reduce的cleanup方法中调用mos.close();ps 其他可能原因:1. reduce一直都没有输入,这个要查看MR Job的计数器。我之前因为Reduce的输入Key格式跟Map 输出要求不匹配,导致Reduce一直没有输入,这个需要查看MR Job的日志。通过在初始化Job时声明job.setMapOutputKeyClass(T); job.setMapOutputValueClas. 阅读全文
摘要:
原生的计数器有(格式:<显示名> | <内部名>):FileSystemCounters | FileSystemCounters---FILE_BYTES_READ | FILE_BYTES_READ---FILE_BYTES_WRITTEN | FILE_BYTES_WRITTEN---HDFS_BYTES_READ | HDFS_BYTES_READ---HDFS_BYTES_WRITTEN | HDFS_BYTES_WRITTENJob Counters | org.apache.hadoop.mapred.JobInProgress$Counter---Tot 阅读全文