Ubuntu 之旅（一）中文编码

中文编码问题是大伙在所有linux操作系统中经常问到的问题。个人方面，我喜欢utf-8编码，全球通用。很讨厌GB2312，GBK等编码，字符集又不全，全球支持性又差。但是没办法，我国官方标准(注：GBK最初是由于微软面对GB2312字符太少问题，对GB2312进行的扩展，中华人民共和国国家有关部门将其作为技术规范，严格说GBK并非国家正式标准)。2000年新出的 GB18030编码用的比较少，暂不评论。

由于很多中文文档的都是用GB2312或者GBK编码，所以linux上我们必须要使之支持这两个编码。

Ubuntu 默认采用UTF8编码，可以方便global。但对中文支持，还不细致，即便默认采用中文安装，也并不会自动添加GB*等支持，致使在Ubuntu下访问一些中文文本文件时，出现乱码。解决方法（摘录自网上）：

I. 配置系统环境
执行 sudo vi /var/lib/locales/supported.d/zh
加入以下配置参数

zh_CN.GB18030 GB18030 (最新汉字编码字符集，向下兼容GBK,GB2312)
zh_CN.GBK GBK (汉字扩展编码,向下兼容GB2312, 并包含BIG5全部汉字)
zh_CN.GB2312 GB2312 (简化汉字编码字符集,)
zh_CN.GB18031 GB18031 (数字键盘汉字编码输入,面向手持设备)
zh_HK.BIG5 BIG5 (繁体)
zh_TW.BIG5 BIG5 (繁体)

然后执行 sudo locale-gen
提示以下信息，成功了
zh_CN.GB18030... done
zh_CN.GBK... done
......

II. 系统环境支持GB*内码了，但用vi, gedit等工具访问文件还会继续乱码，需要针对不同的工具分别配置，使之自己检测支持范围内的编码
e.g. vi
执行 sudo vi /etc/vim/vimrc
加入以下配置参数
let &termencoding=&encoding
set fileencodings=utf-8,gb18030,gbk,gb2312,big5

e.g. gedit
执行 sudo gconf-editor
选择 apps/gedit-2/preferences/encodings
找到 auto_detected 编辑，在Values中分别加入 GB18030,GBK,GB2312,BIG5 ，同时需要把GB18030位置调到最上方

OK~

posted @ 2010-07-02 12:07 MichaelChen 阅读(437) 评论(0) 编辑收藏举报

刷新页面返回顶部

重重的壳裹着轻轻的仰望

Yesterday is history,tomorrow is a mystery ,but today is a gift ,that is why it is called present

Ubuntu 之旅（一）中文编码

公告