2014年7月10日

MapReduce中,new Text()引发的写入HDFS的输出文件多一列的问题

摘要: 前段时间业务系统有个模块数据没有了,在排查问题的时候发现中间处理环节出错了,错误日志为文件格式不正确,将数据导出后发现这个处理逻辑的输入文件中每一行都多了一列,而且是一个空列(列分隔符是\t)。第一次检查代码后没发现代码里多写了一列,第二次排查Reduce代码时,发现在写文件时value为空的Tex... 阅读全文

posted @ 2014-07-10 15:16 sixiiweb 阅读(2988) 评论(0) 推荐(0) 编辑

导航