编码问题的介绍
首先我使用的开发环境是Eclipse.创建一个Java Project默认的编码则为GBK,如图:
下面便是具体代码:
1 import java.io.UnsupportedEncodingException; 2 3 public class Demo1 { 4 public static void main(String[] args) throws UnsupportedEncodingException { 5 String s = "我爱ABC"; 6 byte[] bytes1 = s.getBytes("gbk");//不写编码,则使用平台的默认字符集将此 String 编码为 byte序列,并返回byte[]. 7 //s.getBytes(Charset charset) 使用给定的charset将此String编码到byte序列; 8 //返回的是一个byte[]字节数组 9 10 for(byte b: bytes1){ 11 System.out.print(Integer.toHexString(b&0xff)+" "); 12 //Integer.toHexString(int i)以十六进制(基数 16)无符号整数形式返回一个整数参数的字符串表示形式 13 } 14 //gbk编码中文占有两个字节,英文占有一个字节 15 System.out.println(); 16 byte[] bytes2 = s.getBytes("utf-8"); 17 for(byte b: bytes2){ 18 System.out.print(Integer.toHexString(b&0xff)+" "); 19 } 20 //utf-8编码 中文占有三个字节,英文占有一个字节 21 System.out.println(); 22 //java是双字节编码 --->utf-16be >> 中文和英文都占有两个字节 23 byte[] bytes3 = s.getBytes("utf-16be"); 24 for(byte b: bytes3){ 25 System.out.print(Integer.toHexString(b&0xff)+" "); 26 } 27 28 /*当你的字节序列是某种编码时,这个时候想把字节序列变成 29 *字符串,也需要用这种编码方式,否则会出现乱码 30 * */ 31 System.out.println(); 32 String str1 = new String(bytes3);//用项目默认的编码即(GBK编码) ----->> bytes3在上面定义成“utf-16be”的编码了,所以会出现乱码 33 System.out.println(str1); 34 System.out.println(); 35 36 String str2 = new String(bytes3,"utf-16be"); 37 System.out.println(str2); 38 39 /* 40 * 文本文件就是字节序列 41 * 可以是任意编码的字节序列 42 * 如果我们在中文机器上直接创建文本文件,那么该文本文件只认识ansi编码 43 * 44 */ 45 } 46 }
打印的结果:
总的来说,编码必须对应,不然会出现乱码。