Java中的String类和编码转换

构造方法:

String(byte[] bytes, int offset, int length) 
          通过使用平台的默认字符集解码指定的 byte 子数组,构造一个新的 String。 
String(byte[] bytes, int offset, int length, Charset charset) 
          通过使用指定的 charset 解码指定的 byte 子数组,构造一个新的 String。 
String(byte[] bytes, int offset, int length, String charsetName) 
          通过使用指定的字符集解码指定的 byte 子数组,构造一个新的 String。  
String(char[] value, int offset, int count) 
          分配一个新的 String,它包含取自字符数组参数一个子数组的字符。 
String(int[] codePoints, int offset, int count) 
          分配一个新的 String,它包含 Unicode 代码点数组参数一个子数组的字符。

将“南山南”转换为UTF-8字节码

import java.nio.*;
String str = "南山南";
Charset charset_utf8 = Charset.forName("utf-8");
ByteBuffer buff = charset_utf8.encode(str);
byte[] bArr = new byte[buff.remaining()];
buff.get(bArr); 

把字符串以指定编码转为byte[]和把byte[]以指定编码转为字符串。

public static void Utf8ToUnicode() throws UnsupportedEncodingException {
    String str="中文";        
    byte[] bArr = str.getBytes("unicode");  //bArr[0]=fe,bArr[1]=ff;从bArr[2]开始为编码内容
    String str1 = new String(bArr, "utf16");  //utf16和unicode编码一样
    System.out.println(str1);
}
posted @ 2018-12-07 09:17  xuejianbest  阅读(8728)  评论(0编辑  收藏  举报