根据GB2312编码表求汉字字节

   java中有8种基本数据类型,byte,short,int,long,float,double,boolean 
byte用1个字节表示,占8比特,取值范围 负2的7次方至正2的7次方减1 二进制00000000  第一位0如果为0表示正数 1表示负数 
short用2个字节表示,占16比特,取值范围  负2的15次方至正2的15次方减1  二进制00000000 00000000  第一位0如果为0表示正数 1表示负数 
int用4个字节表示,占32比特,取值范围  负2的31次方至正2的31次方减1  二进制00000000 00000000 00000000 00000000 第一位0如果为0表示正数 1表示负数 
long用8个字节表示,占64比特,取值范围  负2的15次方至正2的15次方减1  二进制00000000 00000000 00000000 00000000 00000000 00000000  00000000 00000000     第一位0如果为0表示正数 1表示负数 
float用4个字节表示,占32比特 
double用8个字节表示,占64比特 
以上7种都属有符号数 

char用2个字节表示,占16比特 00000000 00000000 2的16次方 0至65536 

boolean只有2个值,TRUE和FALSE 
java自动转型方向 
         char->int->long->float->double 
byte->short->int->long->float->double 

JAVA中的字节存的是补码 
举个例子 
"中"字 
以GB2312中的编码为D6D0  (GB2312编码表可参看http://ash.jp/code/cn/gb2312tbl.htm) 
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 
D6A0     帧 症 郑 证 芝 枝 支 吱 蜘 知 肢 脂 汁 之 织 
D6B0  职 直 植 殖 执 值 侄 址 指 止 趾 只 旨 纸 志 挚 
D6C0  掷 至 致 置 帜 峙 制 智 秩 稚 质 炙 痔 滞 治 窒 
D6D0  中 盅 忠 钟 衷 终 种 肿 重 仲 众 舟 周 州 洲 诌 
D6E0  粥 轴 肘 帚 咒 皱 宙 昼 骤 珠 株 蛛 朱 猪 诸 诛 
D6F0  逐 竹 烛 煮 拄 瞩 嘱 主 著 柱 助 蛀 贮 铸 筑   

下面让我们来看一下JAVA里 “中”字取出来的字节是什么 
public class Test { 
public static void main(String args[]){ 
  String a="中"; 
  byte ar[]; 
  try { 
   ar = a.getBytes("GB2312"); 
   for(int i=0;i<ar.length;i++){ 
    System.out.println(ar[i]); 
   } 
  } catch (UnsupportedEncodingException e) { 
   // TODO Auto-generated catch block 
   e.printStackTrace(); 
  } 
  


输出结果为 
-42 
-48 
让我们来看一下如何根据编码表算出这两个数字 
首先明白编码表的表示为16进制 
D6二进制表示为 11010110 最高为符号位1表示负数 0表示正数 
D0二进制表示为 11010000 最高为符号位1表示负数 0表示正数 
让我们来看一下D6如何换算出-42 
将D6的二进制首先换算为10进制,二进制换算为10进制例: 
二进制数转换为十进制数 
二进制数第0位的权值是2的0次方,第1位的权值是2的1次方…… 

所以,设有一个二进制数:0110 0100,转换为10进制为: 

下面是竖式: 

  

0110 0100 换算成 十进制 

  

第0位 0 * 20  =  0 

第1位 0 * 21  =  0 

第2位 1 * 22  =  4 

第3位 0 * 23  =  0 

第4位 0 * 24  =  0 

第5位 1 * 25  = 32 

第6位 1 * 26  = 64 

第7位 0 * 27  =  0     + 

--------------------------- 

              100   

  

用横式计算为: 

0 * 20 + 0 * 21 + 1 * 22 + 1 * 23 + 0 * 24 + 1 * 25 + 1 * 26 + 0 * 27 = 100 

0乘以多少都是0,所以我们也可以直接跳过值为0的位: 

1 * 22 + 1 * 23 +  1 * 25 + 1 * 26 = 100 



 D6二进制表示为 -1010110 

求反码为-0101001 
反码:将二进制数按位取反,所得的新二进制数称为原二进制数的反码。 

取反操作指:原为1,得0;原为0,得1。(1变0; 0变1) 

再求出补码-0101010 


补码:反码加1称为补码。 

也就是说,要得到一个数的补码,先得到反码,然后将反码加上1,所得数称为补码。 

结果为 -0101010=-(25 + 23 +21)=-42 

其它一个相同的计算方式

posted @ 2013-09-25 13:08  若 ♂ 只如初见  阅读(609)  评论(0编辑  收藏  举报