代码改变世界

ORACLE数据库汉字占几个字节问题

2013-12-10 10:31  潇湘隐者  阅读(40362)  评论(2编辑  收藏  举报

一同事由于系统需求关系,将SQL SERVER数据库的一个表导入ORACLE数据库时,发现居然报错:ORA-12899: value too large for column xxxx (actual:56, maximum:50),该字段长度在两个数据库都是50,之所以出现这个错误,原因无外乎两个:

一:因为ORACLE数据库它可以存储字节或字符,例如 CHAR(12 BYTE) CHAR(12 CHAR)的意义是不同的.一般来说默认是存储字节,你可以查看数据库参数NLS_LENGTH_SEMANTICS的值。

   1: SQL> show parameter nls_length_semantics;
   2:  
   3: NAME                          TYPE        VALUE
   4: ------------------------- ----------- -------------
   5: nls_length_semantics          string      BYTE

如果定义为VARCHAR2(50 CHAR),那么该列最多就可以存储50个汉字,如果定义字段为VARCHAR2(50) 或VARCHAR2(50 BYTE)那么它最多可以存储多少个汉字就要视数据库字符集编码决定。

二:ORACLE数据库汉字占用几个字节,要根据ORACLE中字符集编码决定,一般情况下,数据库的NLS_CHARACTERSET 为AL32UTF8或UTF8,即一个汉字占用三到四个字节。如果NLS_CHARACTERSET为ZHS16GBK,则一个字符占用两个字节.

   1: SQL> COL PARAMETER FOR A24;
   2: SQL> COL VALUE FOR A24
   3: SQL> SELECT * FROM v$nls_parameters WHERE PARAMETER='NLS_CHARACTERSET';
   4:  
   5: PARAMETER                VALUE
   6: ------------------------ ------------------------
   7: NLS_CHARACTERSET         UTF8
   8:  
   9: SQL> 
  10:  

至于具体情况,可以通过LENGTHB或者VSIZE函数求得是占用字节数。

   1: SQL> SELECT  LENGTH('您好') FROM DUAL;
   2:  
   3: LENGTH('您好')
   4: --------------
   5:              2
   6:  
   7: SQL> SELECT  LENGTHB('您好') FROM DUAL;
   8:  
   9: LENGTHB('您好')
  10: ---------------
  11:               6
  12:  


LENGTH函数求得是占用字符数,LENGTHB或者VSIZE函数求得是占用字节数。

VSIZE returns the number of bytes in the internal representation of expr. If expr is null, then this function returns null.
This function does not support CLOB data directly. However, CLOBs can be passed in as arguments through implicit data conversion.

LENGTH是计算字符的个数,输入的参数先被转为字符类型计算

The LENGTH functions return the length of char. LENGTH calculates length using characters as defined by the input character set. LENGTHB uses bytes instead of characters. LENGTHC uses Unicode complete characters. LENGTH2 uses UCS2 code points. LENGTH4 uses UCS4 code points.