Ubuntu 之旅(一)中文编码

中文编码问题是大伙在所有linux操作系统中经常问到的问题。个人方面,我喜欢utf-8编码,全球通用。很讨厌GB2312,GBK等编码,字符集又不全,全球支持性又差。但是没办法,我国官方标准(注:GBK最初是由于微软面对GB2312字符太少问题,对GB2312进行的扩展,中华人民共和国国家有关部门将其作为技术规范,严格说GBK并非国家正式标准)。2000年新出的 GB18030编码用的比较少,暂不评论。

由于很多中文文档的都是用GB2312或者GBK编码,所以linux上我们必须要使之支持这两个编码。

Ubuntu 默认采用UTF8编码,可以方便global。但对中文支持,还不细致,即便默认采用中文安装,也并不会自动添加GB*等支持,致使在Ubuntu下访问一些中文文本文件时,出现乱码。解决方法(摘录自网上):

I.
配置系统环境
执行 sudo vi /var/lib/locales/supported.d/zh
加入以下配置参数

zh_CN.GB18030 GB18030 (
最新汉字编码字符集,向下兼容GBK,GB2312)
zh_CN.GBK GBK (
汉字扩展编码,向下兼容GB2312, 并包含BIG5全部汉字)
zh_CN.GB2312 GB2312 (
简化汉字编码字符集,)
zh_CN.GB18031 GB18031 (
数字键盘汉字编码输入,面向手持设备)
zh_HK.BIG5 BIG5 (
繁体)
zh_TW.BIG5 BIG5 (
繁体)

后执行 sudo locale-gen
提示以下信息,成功了
zh_CN.GB18030... done
zh_CN.GBK... done
......

II.
系统环境支持GB*内码了,但用vi, gedit等工具访问文件还会继续乱码,需要针对不同的工具分别配置,使之自己检测支持范围内的编码
e.g. vi
执行 sudo vi /etc/vim/vimrc
加入以下配置参数
let &termencoding=&encoding
set fileencodings=utf-8,gb18030,gbk,gb2312,big5

e.g. gedit
执行 sudo gconf-editor
选择 apps/gedit-2/preferences/encodings
找到 auto_detected 编辑,在Values中分别加入 GB18030,GBK,GB2312,BIG5 ,同时需要把GB18030位置调到最上方

OK~

 

posted @ 2010-07-02 12:07  MichaelChen  阅读(437)  评论(0编辑  收藏  举报