Lecture 02 Bits, Bytes, and Integer

通过位可以表示集合

例如，一个 $8$ 位的二进制数 $01101001$ ，可以用于表示一个全集为 ${0, 1, 2, 3, 4, 5, 6, 7}$ 的集合 ${0, 3, 5, 6}$

$01101001$
$76543210$

通过上面的一一对应关系可以确认集合中的元素。
通过这种表示方法，二进制的位运算可以转换为集合之间的运算：

符号	位运算	集合运算
&	与	交集
\|	或	并集
^	异或	对称差
~	非	补集

通过逻辑运算符的短路特性可以避免访问空指针

int *p;
if (p && *p) {
    ...
}

当 $p$ 为空指针时，会直接返回 $0$ ，当 $p$ 不为空指针时，才会对 $* p$ 的值进行判断。

位移运算

当进行位移运算时，向左位移只有唯一一种情况，而向右位移有两种情况，分为逻辑位移和算数位移。两种右位移的区别是填充方式不同。

位移方式	填充
左位移	$0$
逻辑右位移	$0$
算数右位移	符号位( $0$ 或 $1$ )

举例如下：

运算方式	二进制表示
$x$	$01100010$
<< $3$	$00010000$
Log.>> $2$	$00011000$
Arith.>> $2$	$00011000$

运算方式	二进制表示
$x$	$10100010$
<< $3$	$00010000$
Log.>> $2$	$00101000$
Arith.>> $2$	$11101000$

补码的实际含义

在有符号整数的计算过程中，将最高位作为负数进行计算，即可直接得到补码，而不需要取反再加一。
用5位数举例如下：

	4	3	2	1	0
原码	16	8	4	2	1
补码	-16	8	4	2	1

假设一个数为 $(10110)_{2}$ ，即 $(- 10)_{10}$
正常方式计算：补码 $10110$ $=>$ 反码 $10101$ $=>$ 原码 $11010$ => $- 8 + (- 2) = - 10$
新算法：补码 $10110$ => $- 16 + 4 + 2 = - 10$

通过这种方式可以更好理解补码编码后的极值问题。例如只有 $5$ 位的情况下，只有第一位表示负数，因此最小的负数一定是 $10000$ ，而最大的正数一定是 $01111$ 。

无符号整数和有符号整数的转换关系

存在如图的映射关系，其中 $T M a x$ 为有符号整数上限， $T M i n$ 为有符号整数下限， $U M i n$ 为无符号整数上限

$U M a x = 2 T M a x + 1$ 的解释

$T M a x = 011. . .1$
$2 T M a x = T M a x << 1 = 11. . .10$
$2 T M a x + 1 = 11. . .11 = U M a x$

编程时可能出现的问题

当 $i$ 为无符号整数时
for (i = n - 1; i >= 0; i--) {...}
由于 $i$ 为 $0$ 时，再次减一会得到 $U M a x$ ，因此该循环将不会结束。
当循环条件中出现sizeof（返回值为size_t，无符号）时容易出现该问题，如：
for (int i = n - 1; i - sizeof(char) >= 0; i--) {...}
此时由于sizeof(char)为无符号，因此运算时 $i$ 会被转换为无符号整数，循环变为死循环。

符号位拓展

可以使用任意位作为符号位，不会影响数值大小。
当该数为正数时，填充符号位填充的数为 $0$ ，不影响大小。
当该数位负数时，填充符号位填充的数为 $1$ ，假设该数有 $n$ 位：
计算补码可以发现，新填充的 $1$ 表示的数为 $- 2^{n}$ ，原本的符号位 $1$ 表示的数为 $2^{n - 1}$ ，两者相加会得到 $- 2^{n - 1}$ ，与原符号位相同，因此也不影响大小。
举例：

原数为 $(0110)_{2}$ ，即 $(3)_{10}$
扩充一位后得到 $(00110)_{2}$ ， $2 + 1 = (3)_{10}$
原数为 $(1110)_{2}$ ，即 $(- 2)_{10}$
扩充一位后得到 $(11110)_{2}$ ， $- 8 + 4 + 2 + 1 = (- 2)_{10}$

该操作也解释了右移位时算数移位的意义，即将右移位作为除 $2^{n}$ 的除法时，填充 $1$ 才会得到正确的除法结果。

二进制截断

对于无符号整数，截断二进制的后 $n$ 位相当于对 $2^{n}$ 取模。

对于 $(11011)_{2}$ ，即 $(27)_{10} ，$ 截断其后 $4$ 位，得到 $(1011)_{2}$ ，即 $(11)_{10}$ ，相当于对 $2^{4} = 16$ 取模。
对于有符号整数，没有计算方面的关联性，但是将其转换为无符号整数后可以进行相同的取模操作。

posted @ 2024-11-19 14:13 _Konnyaku 阅读(20) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 位运算符：原码、反码、补码

· 二进制与位运算学习笔记

· 41.位运算

· 位运算小记顺带复习一下原码补码反码

· 5、位运算

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· winform 绘制太阳，地球，月球运作规律
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 上周热点回顾（3.3-3.9）
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人

公告

昵称： _Konnyaku
园龄： 4年11个月
粉丝： 0
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

Lecture 02 Bits, Bytes, and Integer

通过位可以表示集合

通过逻辑运算符的短路特性可以避免访问空指针

位移运算

补码的实际含义

无符号整数和有符号整数的转换关系

$U M a x = 2 T M a x + 1$ 的解释

编程时可能出现的问题

符号位拓展

二进制截断

公告

搜索

常用链接

随笔分类

随笔档案

文章分类

阅读排行榜

Lecture 02 Bits, Bytes, and Integer

通过位可以表示集合

通过逻辑运算符的短路特性可以避免访问空指针

位移运算

补码的实际含义

无符号整数和有符号整数的转换关系

UMax=2TMax+1的解释

编程时可能出现的问题

符号位拓展

二进制截断

公告

搜索

常用链接

随笔分类

随笔档案

文章分类

阅读排行榜

$U M a x = 2 T M a x + 1$ 的解释