学习:UTF-8和GBK的区别

论编码问题又碰到了,为什么不用UTF8而用GBK呢?这个问题专业的解释好像网上有很多,但对我来讲,我只想知道用哪个有什么好处就够了。

下面是我用我个人应用中感觉到的及最简单的通俗的看法去理解这两种编码的区别?

含义上区别1:GBK相关于我国的中文语言,UTF8相当于世界通用的英文语言。

感觉上区别2:用DW编码UTF8字体时感觉看不清楚,GB2312比较清楚。

字节上区别3:从字节上区分  GBK的文字编码是双字节来表示的,占用空间大,UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),对于英文字符较多的论坛则用UTF-8节省空间。

字符上区分4:GBK包含全部中文字符; UTF-8则包含全世界所有国家需要用到的字符。

编码上区分5:GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准) UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。例如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。 

使用上区分6:GBK是中国国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大,而且是一般做论坛的DZ这些程序,对应的组件和插件支持上GBK相应开发的比较全面点,再DIY的时候比较方便。UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛,而且中文可以直接识别,如果你的论坛要做的比较国际化那就必须用UTF8的。补充下:UTF8再繁体支持上比GBK有优势滴。对于DZ论坛来说,很多插件都只支持GBK的,如果需要装较多插件的论坛还是用GBK比较好,而对装较少插件且有特殊用户群的论坛用UTF8比较好。所以,一般你要是做论坛只是国内的特定圈子里的就用GBK简单点,基本插件都可以安装,但是如果你的站有国外的市场需要就建议UTF8了。

搜索上区分7:都说GG中文搜索没百度强。估计跟编码可能也有关系。GBK,GB2312可能让百度更感兴趣!

最后总结一句话:感觉在中国做最好还是用GBK,GB2312,等应该隐藏好处还是有的,做世界网站UTF8。

下现是一组编码收录字符的数据:

GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号;    1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符。  2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。

posted @ 2011-06-09 16:54  飞翔荷兰人  阅读(4157)  评论(1编辑  收藏  举报

I Love Lina~