java 中文 字符对应的byte 为什么是负数。。二进制 到 16进制

暂存还没有搞明白

 

一个字节占8位,可以表示 00000000-11111111 , 其中首位为符号位,也就是说能表示【-128--127】之间。

为什么是8位,因为英文中256已经能够包含所有字符了。但是这样的话,其他国家的文字没法表示了,所以发明了utf-8国际统一编码,

基本可以表示世界上所有字符了。

而中文也有专门的编码GBK,一个字符占2个字节,就是16位,编码定义第一个字节从129开始,第二个字节从65开始。

129  对应二进制 1000 0001 ,由于第一位是符号位1 ,为负数,所以汉字的第一个byte 都是负数,

如“一“对应210,187 二进制为11010010 ,10111011 首位都是1 所以都是byte 值都是负数。

如“丄”对应 129,65  第一个字节为负,第二个字节为正。

//打印部分中文和字节码
for(int i=129;i<255;i++){
            for(int j=65;j<255;j++){
                byte[] b = {(byte)i,(byte)j};
                System.out.print(new String(b)+i+j+" ");
            }
            System.out.println();
        }

 二、二进制到16进制

8位2进制最大表示255 , 16进制两位最大为ff ,也是255. 所以可以2位16进制数就可以表示8位二进制。 

即一个16进制可以表示4位2进制。随意B64 转换为16进制就是 16位(64/4)。

posted on 2019-07-09 20:43  远方的人  阅读(1291)  评论(0编辑  收藏  举报

导航