一.UTF8字符集csv文件在oracle下乱码问题处理

　　1.问题描述

　　在excel中生成了一个UTF-8编码格式的csv文件准备导入数据库，在notpad++下打开显示正常，编码集为UTF-8，通过pl/sql dev导入oracle是出现乱码，此时初步推断oracle字符集与本地操作不同导致的乱码

　　2.处理过程

　　2.1 查看ORACLE字符编码集

　　select userenv('language') from dual;

　　此时oracle返回其字符编码为：SIMPLIFIED CHINESE_CHINA.ZHS16GBK

　　2.2 添加操作系统对象字符编码系统变量

　　在win10中添加如下系统变量

　　变量名:NLS_LANG

　　变量值:SIMPLIFIED CHINESE_CHINA.ZHS16GBK

　　2.3 更改文件字符集

　　2.3.1 excle

　　从excle导出的csv文件只能直接导出为utf-8格式，暂未发现有其他方法可以直接导出其他字符编码类型的csv文件

　　2.3.2 notpad++

　　在notpad++中直接通过编码->转换为GB2312(notpad++没有gbk，gbk是GB2312的超集),结果文件出现乱码，此方法不可行;

　　在notpad++中新建一个空文件，将其字符编码集变为gb2312，再将原来csv文件的内容复制过来，发现没有出现乱码，且字符编码集设置成功

　　2.3.3 sublime

　　使用sublime 安装ConvertToUTF8 插件可以实现编码集转换

　　安装过程：ctr+shift+p打开完成搜索框，输入install package 打开可安装插件列表界面，在此界面输入ConvertToUTF8 可直接安装该插件

　　使用方法：打开UTF编码集的csv文件，点击file->relaod with encoding,在其中选择目标字符编码，这里我们选中gbk，点击之后，文件已转化为gbk编码，再保存即可

　　2.3.4 java编写工具类

　　1 public void codeChange() throws IOException {

　　2 String sourceCharset = "utf8"; // 源文件编码

　　3 String targetCharset = "gbk"; // 目标文件编码

　　4 String newFileName=path.substring(0,path.lastIndexOf("."))+"_"+1+".csv";

　　5 File file =new File(path);//源文件

　　6 FileInputStream fileInputStream=new FileInputStream(file);

　　7 InputStreamReader inputStreamReader=new InputStreamReader(fileInputStream,sourceCharset);

　　8 BufferedReader bufferedReader=new BufferedReader(inputStreamReader);

　　9 File targetFile =new File(newFileName);//目标文件

　　10 BufferedWriter bufferedWriter=new BufferedWriter(new OutputStreamWriter(new FileOutputStream(targetFile),targetCharset));

　　11 String line=null;

　　12 while((line=bufferedReader.readLine())!=null){

　　13 bufferedWriter.write(line);

　　14 bufferedWriter.newLine();

　　15 bufferedWriter.flush();

　　16 }

　　17 bufferedWriter.close();

　　18 bufferedReader.close();

　　19 }

　　复制代码

　　2.4 注意事项

　　2.4.1 在利用notpad++或sublime更改字符集时，最好先对文件进行备份，因为编码转化可能是不可逆过程

　　2.4.2 一般遇到字符编码不统一，修改一方即可，这里我们选择修改操作系统的是因为避免对其他文件造成影响，也可以选择修改oracle的字符编码集，但是对数据库中其他数据会造成影响(编辑：雷林鹏来源：网络)

posted @ 2018-08-13 09:47 雷林鹏阅读(2959) 评论(0) 编辑收藏举报

刷新页面返回顶部

雷林鹏

一.UTF8字符集csv文件在oracle下乱码问题处理

公告