一文搞明白位运算、补码、反码、原码
在平时看各种框架的源码的过程中,经常会看到一些位移运算,所以作为一个Java开发者是一定掌握位移运算的。
正数位移运算
Java中有三个位移运算:
<<:左移
>>:右移
>>>:无符号右移
我们直接看一下Demo:
System.out.println(2 << 1); // 4
System.out.println(2 >> 1); // 1
System.out.println(2 >>> 1); // 1
System.out.println(-2 << 1); // -4
System.out.println(-2 >> 1); // -1
System.out.println(-2 >>> 1); // 2147483647
乍一眼看到上面Demo的打印结果,你应该是懵逼的,接下来我来解释一下这个结果到底是如何运算出来的。
上面的Demo中有“2”和“-2”,这是两个十进制数,并且是int类型的(java中占四个字节),位运算是基于二进制bit来的,所以我们需要将十进制转换为二进制之后再进行运算:
2 << 1
:十进制“2”转换成二进制为“00000000 00000000 00000000 00000010”,再将二进制左移一位,高位丢弃,低位补0,所以结果为“00000000 00000000 00000000 00000100”,换算成十进制则为“4”2 >> 1
:十进制“2”转换成二进制为“00000000 00000000 00000000 00000010”,再将二进制右移一位,低位丢弃,高位补0,所以结果为“00000000 00000000 00000000 00000001”,换算成十进制则为“1”
对于这两种情况非常好理解,那什么是无符号右移,以及负数是怎么运算的呢?
我们先来看-2 << 1
与-2 >> 1
,这两个负数的左移与右移操作其实和正数类似,都是先将十进制数转换成二进制数,再将二进制数进行移动,所以现在的关键是负数如何用二进制数进行表示。
原码、反码、补码
接下来我们主要介绍十进制数用二进制表示的不同方法,所以为了简洁,我们用一个字节,也就是8个bit来表示二进制数。
原码
十进制 | 原码 |
2 | 0000 0010 |
-2 | 1000 0010 |
原码其实是最容易理解的,只不过需要利用二进制中的第一位来表示符号位,0表示正数,1表示负数,所以可以看到,一个数字用二进制原码表示的话,取值范围是-111 1111 ~ +111 1111
,换成十进制就是-127 ~ 127
。
反码
在数学中我们有加减乘除,而对于计算机来说最好只有加法,这样计算机会更加简单高效,我们知道在数学中5-3=2
,其实可以转换成5+(-3)=2
,这就表示减法可以用加法表示,而乘法是加法的累积,除法是减法的累积,所以在计算机中只要有加法就够了。
一个数字用原码表示是容易理解的,但是需要单独的一个bit来表示符号位。并且在进行加法时,计算机需要先识别某个二进制原码是正数还是负数,识别出来之后再进行相应的运算。这样效率不高,能不能让计算机在进行运算时不用去管符号位,也就是说让符号位也参与运算,这就要用到反码。
十进制 | 原码 | 反码 |
2 | 0000 0010 | 0000 0010 |
-2 | 1000 0010 | 1111 1101 |
正数的反码和原码一样,负数的反码就是在原码的基础上符号位保持不变,其他位取反。
那么我们来看一下,用反码直接运算会是什么情况,我们以5-3
举例。
5 - 3
等于 5 + (-3)
十进制 | 原码 | 反码 |
5 | 0000 0101 | 0000 0101 |
-3 | 1000 0011 | 1111 1100 |
5-3
= 5+(-3)
= 0000 0101(反码) + 1111 1100(反码)
= 0000 0001(反码)
= 0000 0001(原码)
= 1
这不对呀?!! 5-3=1?,为什么差了1?
我们来看一个特殊的运算:
1-1
= 1+(-1)
= 0000 0001(反码) + 1111 1110(反码)
= 1111 1111(反码)
= 1000 0000(原码)
= -0
我们来看一个特殊的运算:
0+0
= 0000 0000(反码) + 0000 0000(反码)
= 0000 0000(反码)
= 0000 0000(原码)
= 0
我们可以看到1000 0000表示-0,0000 0000表示0,虽然-0和0是一样的,但是在用原码和反码表示时是不同的,我们可以理解为在用一个字节表示数字取值范围时,这些数字中多了一个-0,所以导致我们在用反码直接运算时符号位可以直接参加运算,但是结果会不对。
补码
为了解决反码的问题就出现了补码。
十进制 | 原码 | 反码 | 补码 |
2 | 0000 0010 | 0000 0010 | 0000 0010 |
-2 | 1000 0010 | 1111 1101 | 1111 1110 |
正数的补码和原码、反码一样,负数的补码就是反码+1。
十进制 | 原码 | 反码 | 补码 |
5 | 0000 0101 | 0000 0101 | 0000 0101 |
-3 | 1000 0011 | 1111 1100 | 1111 1101 |
5-3
= 5+(-3)
= 0000 0101(补码) + 1111 1101(补码)
= 0000 0010(补码)
= 0000 0010(原码)
= 2
5-3=2!!正确。
再来看特殊的:
1-1
= 1+(-1)
= 0000 0001(补码) + 1111 1111(补码)
= 0000 0000(补码)
= 0000 0000(原码)
= 0
1-1=0!!正确
再来看一个特殊的运算:
0+0
= 0000 0000(补码) + 0000 0000(补码)
= 0000 0000(补码)
= 0000 0000(原码)
= 0
0+0=0!!也正确。
所以,我们可以看到补码解决了反码的问题。
所以对于数字,我们可以使用补码的形式来进行二进制表示。
负数位移运算
我们再来看-2 << 1
与-2 >> 1
。
-2用原码表示为10000000 00000000 00000000 00000010
-2用反码表示为11111111 11111111 11111111 11111101
-2用补码表示为11111111 11111111 11111111 11111110
-2 << 1
,表示-2的补码左移一位后为11111111 11111111 11111111 11111100
,该补码对应的反码为
11111111 11111111 11111111 11111100
- 1
= 11111111 11111111 11111111 11111011
该反码对应的原码为:符号位不变,其他位取反,为10000000 00000000 00000000 00000100
,表示-4。
所以-2 << 1 = -4
。
同理-2 >> 1
是一样的计算方法,这里就不演示了。
无符号右移
上面在进行左移和右移时,我有一点没讲到,就是在对补码进行移动时,符号位是固定不动的,而无符号右移是指在进行移动时,符号位也会跟着一起移动。
比如-2 >>> 1
。
-2用原码表示为10000000 00000000 00000000 00000010
-2用反码表示为11111111 11111111 11111111 11111101
-2用补码表示为11111111 11111111 11111111 11111110
-2的补码右移1位为:01111111 11111111 11111111 11111111
右移后的补码对应的反码、原码为:01111111 11111111 11111111 11111111
(因为现在的符号位为0,表示正数,正数的原、反、补码都相同)
所以,对应的十进制为2147483647。
也就是-2 >>> 1 = 2147483647
总结
文章写的可能比较乱,希望大家能看懂,能有所收获。这里总结一下,我们可以发现:
2 << 1 = 4 = 2*2
2 << 2 = 8 = 2*2*2
2 << n = 2*2n
m << n = m * 2n
右移则相反,所以大家以后在源码中再看到位运算时,可以参考上面的公式。