Java 编码 UTF-8

近期在处理文件时发现了相同类型的文件使用的编码可能是不同的。所以想将文件的格式统一一下(由于UTF-8的通用性,决定往UTF-8统一),遇见的第一个问题是:怎样查看现有文件的编码方式。

文件编码问题集锦 
字符串编码(charset,encoding。decoding)问题原理 
Java编码浅析 
判定文件编码或文本流编码的方法
上面的几篇文章能够看成认识编码问题的“从入门到精通” 

假设你看完了上面的文章。一定了解到了,在java中,class文件採用utf8的编码方式,JVM执行时採用utf16。Java的字符串是永远都是unicode的,採用的是UTF-16的编码方式。 

想測试一下,java对UTF-8文件的读写的能力。结果发现了一个非常郁闷的问题,假设通过java写的UTF-8文件,使用Java能够正确的读,可是假设用记事本将同样的内容使用UTF-8格式保存。则在使用程序读取是会从文件里多读出一个不可见字符。


此处有具体描写叙述问题的解决办法,以及解决方式:

http://www.cnblogs.com/luoyanli/archive/2013/04/12/3016139.html

posted @ 2017-05-25 21:11  lytwajue  阅读(1071)  评论(0编辑  收藏  举报