oracle字符集问题总结

在进行web开发和oracle安装的过程中经常有人对字符集搞不清楚,因此对此做一下总结。

1.第一个问题:字符集之间的区别是什么呢?

  常见的字符集有:UTF-8和GBK

  (1)GBK字符集

  • GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。
  • GBK包含全部中文字符;
  • GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
  • GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~

  (2)UTF-8字符集

  •   UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。
  • UTF-8则包含全世界所有国家需要用到的字符。
  • UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。
  • UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛

一般来说,国内的系统如果要保存汉字,一般会选择使用GBK字符集,如果是想做网站等,全球可访问的系统,那么一般选择UTF-8。

2.数据库中哪些字符集需要设置?

数据库分客户端字符集数据库服务器字符集

而oracle的服务器字符集又有两种:常规字符集(一般意义上的数据库字符集)和国家字符集

1. 常规意义上的字符集(一般意义上的数据库字符集):

    (1)用来存储CHAR, VARCHAR2, CLOB, LONG等类型数据

    (2)用来标示诸如表名、列名以及PL/SQL变量等

    (3)用来存储SQL和PL/SQL程序单元等

    (4)一般为:AL32UTF8 或者 ZHS16GBK

2. 国家字符集:

    (1)用以存储NCHAR, NVARCHAR2, NCLOB等类型数据

    (2)国家字符集实质上是为oracle选择的附加字符集,主要作用是为了增强oracle的字符处理能力,因为NCHAR数据类型可以提供对亚洲使用定长多字节编码的支持,而数据库字符集则不能。国家字符集在oracle9i中进行了重新定义,只能在unicode编码中的AF16UTF16和UTF8中选择,默认值是AF16UTF16

 

3.字符集查看方法

数据库字符集:select * from nls_database_parameters;

客户端字符集:select * from nls_instance_parameters;

 

数据库字符集的表示方式为:

SIMPLIFIED CHINESE_CHINA.AL32UTF8

SIMPLIFIED CHINESE_CHINA.ZHS16GBK

 

如果客户端字符集和数据库字符集不一致时,通过plSql登陆时会提示如下错误:

image

 

4.客户端字符集设置方法

    32位客户端:  HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\

    64位客户端:HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\ORACLE\KEY_OraClient11g_home1

 

5.建议的字符集是什么?

   数据库字符集:SIMPLIFIED CHINESE_CHINA.ZHS16GBK(国内大部分数据库还是oracle多,如果做网站的话还是建议使用UTF-8字符集)

   国家字符集:SIMPLIFIED CHINESE_CHINA.AL16UTF16

   客户端字符集:SIMPLIFIED CHINESE_CHINA.ZHS16GBK

   网页字符集:UTF-8

 

经过实验,不会出现乱码。

 

参考文章:

1. oracle 字符集查看与修改

作者:sdjnzqr
出处:http://www.cnblogs.com/sdjnzqr/
版权:本文版权归作者和博客园共有
转载:欢迎转载,但未经作者同意,必须保留此段声明;必须在文章中给出原文连接;否则必究法律责任
posted @ 2014-06-24 15:04  正正杂说  阅读(1211)  评论(0编辑  收藏  举报