Hadoop0.20.2中MapReduce读取gb2312文件出现乱码问题
摘要:
单位用的是Linux系统的字符编码是gb2312,所以生成的文件都是按照默认编码生成的。给我的文件也都是gb2312的,在hadoop中运行mapreduce出现乱码,在网上查资料说是因为hadoop的文件系统默认用的是utf-8,那么只有两条路可以选,要么改文件的编码格式,要么改在Mapredu... 阅读全文
posted @ 2015-09-22 16:06 过省 阅读(1019) 评论(0) 推荐(0) 编辑