[CSAPP笔记][第二章信息的表示和处理]
信息的表示和处理
2.1 信息存储
- 机器级程序将存储器视为一个非常大的字节数组,称为虚拟存储器。
- 存储器的每个字节由一个唯一的数字表示,称为它的地址
- 所有可能地址的集合称为虚拟地址空间
2.1.1 十六进制表示法
python 中十六进制的转变方法
a=15; print(hex(a)) //print:0xf
2.1.2 字
- 字长决定虚拟地址空间的最大大小
- 32位的是4G(2^32)
2.1.3 数据大小
char *
使用了机器的全字长
2.1.4 寻址和字节顺序
-
小端法:大多数Intel兼容机规则(现在最为常用)
- 高位放高地址
-
大端法:IBM 和Sun Microsystems
- 高位放低地址
-
printf(“%.2x “)解析
摘自K&R《C程序设计语言》:
点号,用语分隔字段宽度和精度
表示精度的数。对于字符串,它指定打印的字符的最大个数;对于e、E或f转换,它指
定打印的小数点后的数字位数;对于g或G转换,它指定打印的有效数字位数;对于整型数,它指定打印的数字位数(必要时可填充位0以达到要求的宽度)。
2.1.5 表示字符串
-
在使用ASCII码作为字符码的任何系统都会表示相同的结果,与字节顺序和字大小规则无关。因而,文本数据比二进制数据具有更强的平台独立性
-
Java使用Unicode 来表示字符串。对于C语言也有支持Unicode的程序库
2.1.6 表示代码
即使是相同的一段代码,在不同的机器类型使用不同,不兼容的指令,因此二进制代码是不兼容的。
2.1.7 布尔代数简介
很简单
- 位向量常用于集合的表述(状态压缩常用)
2.1.8 C语言的位级运算
ACM玩的很多了,就不说了
2.1.9 C语言的逻辑运算
||
&&
惰性求值
2.1.10 C语言的移位运算
-
逻辑右移
- 往左边补k个0
-
算术右移
- 往左边补k个最高有效位的值
- 对有符号运算有奇效
潜在问题
- 对于无符号数据,右移必须是逻辑的。
- 对于有符号数据,逻辑,算术都可以。
- 几乎所有编译器对有符号使用算数右移
- 许多程序员也假设使用算数右移
- 可能会存在潜在的兼容性问题
2.2 整数表示
2.2.1 整数数据类型
- 有符号
- 无符号
- 负数比正数大一(有一个-0被表示为最小的那个负数)
2.2.2 无符号数的编码
- 性质:双射
2.2.3 补码编码
用这种方式理解补码,是一种新的不错的思路
- 很容易算出范围。不用思考转成原码。
- 双射,规则没有特例,很容易看出0不能表示两种。
补码,反码
2.2.5 C语言中的有符号数和无符号数
- 默认为有符号,如果需要无符号某尾+U,例:
12345U
2.2.6 扩展一个数字的位表示
- 对于一个无符号数转为更大的数据类型
- 只需要简单地在表示的开头添加0,这种运算称为零扩展
-
对于有符号的数,即补码
- 进行符号扩展(sign extension),就是添加最高有效位的值
-
对比逻辑右移,和算术右移
2.2.7 截断数字
-
截断一个数到k位,即舍去w-k的高位。
-
对于无符号数截断x它到k位的结果相当于
- B2U([Xk-1,Xk-2,….x0])=B2U([Xw-1,Xw-2…x0]) mod 2^k
-
对于有符号的数x。
- 截断的时候还是当做无符号的数看
- B2T([Xk-1,Xk-2,….x0])=U2T(B2U([Xw-1,Xw-2…x0]) mod 2^k
)
建议
- 在大多数情况下使用有符号整数
- java中只支持有符号整数,
>>
算数右移,>>>
才是逻辑右移
- java中只支持有符号整数,
2.3 整数运算
2.3.1 无符号加法
x+y
=(x+y)
mod2^k
-
溢出会舍去
-
阿贝尔群,群论。
2.3.2 补码加法
-
大多数计算机使用同样的机器指令来执行有符号和无符号之和。
-
x(有符号+)y= U2T(T2U(x+y) mod 2^w)
- 先计算x+y
- 将x+y转换为无符号类型z。
- p=z mod 2^w
- 附.(或者直接对x+y的二进制表示进行截断得到p)
- 将p用有符号类型表示
-
正溢出,正常,负溢出。
2.3.3 补码的非
- 因为正负区间的不一致
-
所以最小的那个负数的相反数逆元还是最小的那个负数。
-
对于任意整数
x
。-x
和~x+1
得到的结果完全一样。
2.3.4 无符号乘法
- 只取低w位表示的值,其余截断
2.3.5 补码乘法
-
对于无符号和补码乘法,乘法运算的位级表示都是一样的,是同一条指令。
-
无符号和补码相乘出来的两个数的低W位 永远相等。证明见书。
2.3.6 乘常数
- 因为乘法速度太慢,机器可能会用(加法,减法,移位)来代替乘法。
2.3.7 除以2的幂
-
对于无符号类型或整数,直接右移不会有任何问题。
-
对于负数,最后的值为-48.3,会舍入成 -49,而不是-48.
- 解决方法是
偏置
- 原理:
-
C语言
(x<0 ? (x+(1<<k)-1):x)>>k 等价于x/pwr2k ,pwr2k=2^k
- 解决方法是
2.4 浮点数
之后看,现在先过别的。