Java_I/O读取里的那些中文花样

  废话没有那么多啦.直接切中要害! 对于读取本地文件中文乱码以及改变UTF8格式后依然有部分乱码的操作过程,补救亦或者正确的姿势.先看常规的读取(至少我第一反应想起来就是这么写的...)

 1     //如果失误,抛出IO异常在控制台
 2     public static String read(String filename) throws IOException{
 3         BufferedReader in=new BufferedReader(new FileReader(filename));
 4         String s;
 5         StringBuilder sb=new StringBuilder();
 6         //一行一行的读,直到碰见null则说明文件读到末尾了
 7         while((s=in.readLine())!=null){
 8             //容易读中文乱码,所以设置UTF8
 9             String str=new String(s.getBytes(),"UTF-8");
10             //每次读完一个加上换行符
11             sb.append(str+"\n");
12         }
13         //关闭流
14         in.close();
15         return sb.toString();
16     }

  这样子看起来好高大上啊. 几行代码分分钟就读取文件了呢.[String 可以用list啊 不用换行而已.],但是问题来了...随便打个字,写个文件.咱们读取一下看看.

1 1.//这是 1 ge 文件读取测试
2 2.//目的是为了ceshi文件
3 3.这么正常的打印是为了更好的...
4 4.什么?

  这是测试打印内容,看输出

  

  哎呀呀...什么情况...啰嗦一下:

  问题出在FileReader读取文件的过程中,FileReader继承了InputStreamReader,但并没有实现父类中带字符集参数的构造函数,所以FileReader只能按系统默认的字符集来解码,然后在读取转UTF-8的过程中编码出现损失,造成结果不能还原最初的字符。就是问号了.

  知道了why...那么how呢?哈.就用InputStreamReader 好啦#|BufferedReader in=new BufferedReader(new InputStreamReader(new FileInputStream(filename),"UTF-8"));|# 呐~ 这样就okay喽

 1     //如果失误,抛出IO异常在控制台
 2     public static List<String> readList(String filename) throws IOException{
 3         BufferedReader in=new BufferedReader(new InputStreamReader(new FileInputStream(filename),"UTF-8"));
 4         String s;
 5         List<String> ll=new ArrayList<String>();
 6         //一行一行的读,直到碰见null则说明文件读到末尾了
 7         while((s=in.readLine())!=null){
 8             ll.add(s);
 9         }
10         //关闭流
11         in.close();
12         return ll;
13     }

    Okay~ 这么问题就解决了...其实还有一个更简单呐方法...你文件编码保存的时候就直接UTF-8...哇哈哈哈哈哈~但是不是总惦记这,万一忘了这样保险一点.

 

  _叶落星辰

    @鸣谢 iteye 的 gundumw100  阐述编码为啥子丢了

posted @ 2015-02-04 13:53  ZhLingF  阅读(175)  评论(0编辑  收藏  举报