Hadoop中文编码乱码相关问题

mapreduce程序处理GBK编码数据并输出GBK编码数据, hadoop涉及输出文本的默认输出编码统一用没有BOM的UTF-8的形式，但是对于中文的输出window系统默认的是GBK，有些格式文件例如CSV格式的文件用excel打开输出编码为没有BOM的UTF-8文件时，输出的结果为乱码，只能由UE或者记事本打开才能正常显示。因此将hadoop默认输出编码更改为GBK成为非常常见的需求，具体请参考以下这篇帖子http://www.aboutyun.com/thread-7358-1-1.html

posted @ 2021-07-15 18:03 尐鱼儿阅读(307) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· AI与.NET技术实操系列：向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列：如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探

阅读排行：
· winform 绘制太阳，地球，月球运作规律
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· AI与.NET技术实操系列（五）：向量存储与相似性搜索在 .NET 中的实现
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理

公告

昵称：尐鱼儿
园龄： 6年5个月
粉丝： 20
关注： 1

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:为什么Java7开始在数字中使用下划线
嚯居然从1.7就有这个特性了我1.8用了这么久才知道
--快乐码男男
2. Re:@Resource注解的官方解释
@Autowired 应该是只按照byType装配的吧，没有byName
--James_Harden
3. Re:MYSQL给表添加字段
@好记性不如烂笔头=> 什么问题...
--尐鱼儿
4. Re:MYSQL给表添加字段
alert alter 你搞清楚好不。害人啊
--好记性不如烂笔头=>
5. Re:JAVA实现用户的权限管理
推荐一个针对restful api的认证鉴权框架 sureness - 提供一个针对restful api，无框架依赖，可以动态修改权限(rbac)，多认证策略(jwt,basic..)，更快速度，易...
--8080808