Java 运行时字符编码与解码
以下仅为个人学习的记录,如有疏漏不妥之处,还请不吝赐教。
Java在运行时字符char采用UTF-16进行编码。
public class RuntimeEncoding { public static void main(String[] args) { char c = '中';// Unicode code point :U+4e2d UTF-16: 0x4e2d System.out.printf("0x%x\n", (int) c); // 0x4e2d } }
何为编码?
作为名词时,编码指字节序列,如字符中的UTF-8编码为0xe4b8ad;
作为动词时,编码指用某种方式将字符转换成电脑可以储存的字节序列,如字符中使用UTF-8的编码方式编码成的字节序列是0xe4b8ad.
java的String提供了编码的方法getBytes();
import java.io.UnsupportedEncodingException; public class Encode { public static void main(String[] args) throws UnsupportedEncodingException { String s = "中"; byte[] b = s.getBytes("UTF-8");
System.out.print("编码为 "); for(byte b1 : b) System.out.printf("%x ",b1); // 编码为 e4 b8 ad } }
何为解码?
解码是编码的逆过程,指用某种将字节序列转换成人类可读的字符,如将字节序列0xe4b8ad按照UTF-8的方式转换成字符中。
import java.io.UnsupportedEncodingException; public class Decode { public static void main(String[] args) throws UnsupportedEncodingException { String s = "中"; byte[] b = s.getBytes("UTF-8"); System.out.println("解码为: " + new String(b, "UTF-8")); //解码为 中 } }
一年365天,每天进步一点点。