Java基础-02 字符串(汉字)与16进制字符串转换(无乱码)
字符串转16进制字符串
// 字符串转换成为16进制(无需Unicode编码)
public static String str2HexStr(String str) {
char[] chars = "0123456789ABCDEF".toCharArray();
StringBuilder sb = new StringBuilder(""); //String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组
byte[] bs = str.getBytes();
int bit;
for (int i = 0; i < bs.length; i++) {
bit = (bs[i] & 0x0f0) >> 4; // 高4位, 与操作 1111 0000
sb.append(chars[bit]);
bit = bs[i] & 0x0f; // 低四位, 与操作 0000 1111
sb.append(chars[bit]);
}
return sb.toString().trim();
}
16进制字符串转字符串(汉字)
// 16进制直接转换成为字符串(无需Unicode解码)
public static String hexStr2Str(String hexStr) {
String str = "0123456789ABCDEF";
char[] hexs = hexStr.toCharArray();
byte[] bytes = new byte[hexStr.length() / 2]; //1个byte数值 -> 两个16进制字符
int n;
for (int i = 0; i < bytes.length; i++) {
n = str.indexOf(hexs[2 * i]) * 16;
n += str.indexOf(hexs[2 * i + 1]);
// 保持二进制补码的一致性 因为byte类型字符是8bit的 而int为32bit 会自动补齐高位1 所以与上0xFF之后可以保持高位一致性
//当byte要转化为int的时候,高的24位必然会补1,这样,其二进制补码其实已经不一致了,&0xff可以将高的24位置为0,低8位保持原样,这样做的目的就是为了保证二进制数据的一致性。
bytes[i] = (byte) (n & 0xff);
}
return new String(bytes);
// return new String(bytes,"gb2312"); 转换时指定,则解析时指定
}
编码要一致
byte[] bs = str.getBytes("gb2312"); 也可以指定编码格式,但是解析时也要指定相同的编码格式,否则乱码
return new String(bytes,"gb2312"); 转换时指定,则解析时指定
byte[] bs = str.getBytes("UTF8"); 也可以指定编码格式,但是解析时也要指定相同的编码格式,否则乱码
return new String(bytes,"UTF8"); 转换时指定,则解析时指定
通过知识/经验的分享,节省开发者的时间.