2012年10月31日
摘要: 症状:在Reduce中使用MultipleOutputs根据输入的key输出到某个MultipleOutputs.addNamedOutput()中,程序运行结束却没有对应的输出文件。解决:在Reduce的cleanup方法中调用mos.close();ps 其他可能原因:1. reduce一直都没有输入,这个要查看MR Job的计数器。我之前因为Reduce的输入Key格式跟Map 输出要求不匹配,导致Reduce一直没有输入,这个需要查看MR Job的日志。通过在初始化Job时声明job.setMapOutputKeyClass(T); job.setMapOutputValueClas. 阅读全文
posted @ 2012-10-31 12:03 山君 阅读(509) 评论(0) 推荐(0) 编辑
摘要: 原生的计数器有(格式:<显示名> | <内部名>):FileSystemCounters | FileSystemCounters---FILE_BYTES_READ | FILE_BYTES_READ---FILE_BYTES_WRITTEN | FILE_BYTES_WRITTEN---HDFS_BYTES_READ | HDFS_BYTES_READ---HDFS_BYTES_WRITTEN | HDFS_BYTES_WRITTENJob Counters | org.apache.hadoop.mapred.JobInProgress$Counter---Tot 阅读全文
posted @ 2012-10-31 11:49 山君 阅读(1213) 评论(2) 推荐(0) 编辑