关于oracle数据库使用imp导入后乱码的问题

很多人都碰到过因为字符集不同而使数据导入失败的情况。这涉及三方面的字符集,一是oracel server端的字符集,二是oracle client端的字符集;三是dmp文件的字符集。在做数据导入的时候,需要这三个字符集都一致才能正确导入。

1、查询oracle server端的字符集
  有很多种方法可以查出oracle server端的字符集,比较直观的查询方法是以下这种:SQL>select userenv(‘language’) from dual;
  结果类似如下:AMERICAN _ AMERICA. ZHS16GBK
2、如何查询dmp文件的字符集
  用oracle的exp工具导出的dmp文件也包含了字符集信息,dmp文件的第2和第3个字节记录了dmp文件的字符集。如果dmp文件不大,比如只有几M或几十M,可以用UltraEdit打开(16进制方式),看第2第3个字节的内容,如0354,然后用以下SQL查出它对应的字符集:
  SQL> select nls_charset_name(to_number('0354','xxxx')) from dual;
  ZHS16GBK
  如果dmp文件很大,比如有2G以上(这也是最常见的情况),用文本编辑器打开很慢或者完全打不开,可以用以下命令(在unix主机上):
  cat exp.dmp |od -x|head -1|awk '{print $2 $3}'|cut -c 3-6
  然后用上述SQL也可以得到它对应的字符集。
3、查询oracle client端的字符集
  这个比较简单。在windows平台下,就是注册表里面相应OracleHome的NLS_LANG。还可以在dos窗口里面自己设置,比如:
  set nls_lang=AMERICAN_AMERICA.ZHS16GBK
  这样就只影响这个窗口里面的环境变量。
  在unix平台下,就是环境变量NLS_LANG。
  $echo $NLS_LANG
  AMERICAN_AMERICA.ZHS16GBK
  如果检查的结果发现server端与client端字符集不一致,请统一修改为同server端相同的字符集。
4.导入导出时设置客户端字符集

--查询字符集

select * from nls_database_parameters where parameter='NLS_CHARACTERSET';

--linux客户端
env|grep NLS_LANG
export NLS_LANG=AMERICAN_AMERICA.ZHS16GBK

--windows客户端

echo %NLS_LANG%
set NLS_LANG=AMERICAN_AMERICA.ZHS16GBK

如果linux环境查询不到NLS_LANG,可以重新设置下客户端字符集环境(export NLS_LANG=AMERICAN_AMERICA.ZHS16GBK)

 
posted @ 2019-12-03 09:15  zhangshh  阅读(1327)  评论(0编辑  收藏  举报