Java_I/O读取里的那些中文花样
废话没有那么多啦.直接切中要害! 对于读取本地文件中文乱码以及改变UTF8格式后依然有部分乱码的操作过程,补救亦或者正确的姿势.先看常规的读取(至少我第一反应想起来就是这么写的...)
1 //如果失误,抛出IO异常在控制台 2 public static String read(String filename) throws IOException{ 3 BufferedReader in=new BufferedReader(new FileReader(filename)); 4 String s; 5 StringBuilder sb=new StringBuilder(); 6 //一行一行的读,直到碰见null则说明文件读到末尾了 7 while((s=in.readLine())!=null){ 8 //容易读中文乱码,所以设置UTF8 9 String str=new String(s.getBytes(),"UTF-8"); 10 //每次读完一个加上换行符 11 sb.append(str+"\n"); 12 } 13 //关闭流 14 in.close(); 15 return sb.toString(); 16 }
这样子看起来好高大上啊. 几行代码分分钟就读取文件了呢.[String 可以用list啊 不用换行而已.],但是问题来了...随便打个字,写个文件.咱们读取一下看看.
1 1.//这是 1 ge 文件读取测试 2 2.//目的是为了ceshi文件 3 3.这么正常的打印是为了更好的... 4 4.什么?
这是测试打印内容,看输出
哎呀呀...什么情况...啰嗦一下:
问题出在FileReader读取文件的过程中,FileReader继承了InputStreamReader,但并没有实现父类中带字符集参数的构造函数,所以FileReader只能按系统默认的字符集来解码,然后在读取转UTF-8的过程中编码出现损失,造成结果不能还原最初的字符。就是问号了.
知道了why...那么how呢?哈.就用InputStreamReader 好啦#|BufferedReader in=new BufferedReader(new InputStreamReader(new FileInputStream(filename),"UTF-8"));|# 呐~ 这样就okay喽
1 //如果失误,抛出IO异常在控制台 2 public static List<String> readList(String filename) throws IOException{ 3 BufferedReader in=new BufferedReader(new InputStreamReader(new FileInputStream(filename),"UTF-8")); 4 String s; 5 List<String> ll=new ArrayList<String>(); 6 //一行一行的读,直到碰见null则说明文件读到末尾了 7 while((s=in.readLine())!=null){ 8 ll.add(s); 9 } 10 //关闭流 11 in.close(); 12 return ll; 13 }
Okay~ 这么问题就解决了...其实还有一个更简单呐方法...你文件编码保存的时候就直接UTF-8...哇哈哈哈哈哈~但是不是总惦记这,万一忘了这样保险一点.
_叶落星辰
@鸣谢 iteye 的 gundumw100 阐述编码为啥子丢了
---迈步走向前方,远离尘世的喧嚣---