《程序员的数学课》模块一 无处不在的数学思维01
01 | 从计数开始,程序员必知必会的数制转换法
数制
数制是一种计算数量大小的制度,也是计数法。用大白话来说,就是数数的方法。
数制中,最重要的因素是基数。假设我们设置基数为 10 来数数,那就是在用十进制计数法;如果设置基数为 2,就是在用二进制计数法。经常说的进制,其实就是数制
不同的数制中,使用最广泛的就是十进制,这与人类有 10 个手指头是密不可分的。人类在学习计数和四则运算时,会通过手指头辅助计算。
- 在我国的古代,也曾经使用过十六进制。例如,成语半斤八两的含义是彼此不相上下,实力相当。即半斤就是 8 两,1 斤就是 16 两。
-在时间的计数场景时,我们也用过二十四进制和六十进制。例如,1 天等于 24 小时,1 小时等于 60 分钟,1 分钟等于 60 秒。还有的常用:温度计数场景、信息计数场景、航距计数场景、这些都是数制在起作用
不同的数制表达
有了不同的数制,就需要对数制下的数字进行区分,否则就会造成混淆。例如,象征考试得了满分的 100,在十进制下依旧是 100;而在二进制下,它就是十进制下的 4。0b100=4;在八进制,则表示十进制下的 640o100=64;在十六进制,则表示十进制下的 256。0x100=256
至于为什么如此计算转换,下文的数制转换方法会详细讲解。
所以如果对数字不加以说明,你会发现很难判断这到底是哪个数制下的数字,毕竟同一数字在不同数制下其意义是完全不同的。为了避免混淆,我们对不同数制下的数字做了区分。
十进制使用的数字符号是 [0,1,2,3,4,5,6,7,8,9];对于二进制和八进制,它们仍然沿用十进制的数字符号。在十六进制中,由于数字符号不够用,这就需要额外补充。一般用 [A,B,C,D,E,F](一般不会特别区分字母的大小写),分别代表十进制下的 [10,11,12,13,14,15]。
一般而言,没有额外说明的数字都是十进制下的数字;
表示二进制时,会用 0b 作为数字的前缀;
表示八进制时,会用 0o 或者 0 作为数字的前缀;
表示十六进制时,会用 0x 作为数字的前缀。
这里 b、o、x 三个英文字母的选择均来自数制的英文单词。
综上,我们对这几个数制的信息整理如下表:
数制转换方法下面的转换方法都是针对的整数,小数的话要用的补码,这个会复杂,具体怎么进行小数的转换呢?
人们在使用数制进行计算时,都习惯性地把原问题映射到十进制中;计算完成后,再映射回去。这里就牵涉数制的转换啦。就是因为人类习惯10进制,所以才要转换
我举一个生活中最常见的数制转换的例子。
例如,上午 8:40 开始考试,考试时长是 40 分钟,问考试结束的时间是多少?
计算过程是:考试时长的40 分钟加上 8 点过 40 分的40 分钟就是 80 分钟,也即是 1 小时 20 分钟,再加上 8 点本身,结束时间就是上午 9:20。
“40分钟+40分钟=80分钟”就是十进制的算术过程,可见为了完成其他数制的运算,我们依旧更喜欢用十进制做桥梁,毕竟我们对十进制的运算是最熟悉的。
1.换基法(换向十进制)
对于任意一个基数 N 进制下的数字 X,它转换为十进制的方法。如下图的公式所示:原进制若是 N 进制,转换时的基数便取 N。例如,将二进制的 X 转化为十进制时,运算时的转换基数便取为 2。
2. 除余法(十进制向其他进制转换)
转向的目标进制为 N 进制,则以 N 为除数不断地做除法,将最后的商和之前的余数逆序串联在一起,就是最终的结果。
例如,十进制的 19 转换为二进制的过程如下图所示:
3. 按位拆分法和按位合并法
对于八进制和二进制之间的转换,你可以利用十进制做个跳板。
除此之外,还有一个简单的按位拆分法,可以将八进制转为二进制。
你只需要把原来八进制中的每个数字符号,直接拆分为3 位的二进制数字符号(必须保证是 3 位),再按顺序串联起来,就是最终结果。
我们以八进制下的 023 为例进行讲解:
-
由于十进制的 2 的二进制表示是 010;
-
十进制的 3 的二进制表示是 011;
-
最后,别忘加上二进制的符号 0b,并去掉首位 0。
则八进制的 023 的二进制表示就是 0b10011,如下图
同理:
- 二进制转换为八进制,可以采用每 3 位合并的按位合并法。
二进制的 0b10011 转换为八进制,则从后往前每 3 位合并 - 对于十六进制和二进制之间的转换,也可以采用按位合并和按位拆分的方法,区别只是在于需要按4 位进行合并或拆分
为何八进制与二进制的转换是按照 3 位数合并、拆分,而十六进制与二进制之间则是 4 位数呢?本质原因是在于 2³=8 和 2⁴=16。根据这表达式可以看出,二进制中的 3 个 bit(位),恰好可以表示 0~7 这 8 个数字。因此,按照 3 位合并,就可以从二进制转化到八进制了。同理,按照 4 位合并,就可以从二进制转化到十六进制了。<span style="color:bulle;"就是求对数;以2为底的8的对数;以2为底的16的对数
而八进制与十六进制之间的转换,就不适用按位合并和按位拆分的方法了,你可以以二进制或十进制为跳板,进行两者之间的转换。
4. 数制转换图
只要把这个图画出来,就能转换进制了
数制转换与编程
【例题】判断一个整数 a,是否是 2 的整数次幂。
解析:如果是十进制,判断一个数是否是 10 的整数次幂,只需要看这个数字的形式是否为一个“1”和若干个“0”构成。例如,一个“1”和两个“0”构成“100”,它是 10 的 2 次幂;一个“1”和 4 个“0”构成“10000”,它是 10 的 4 次幂。
因此这个题目的解法就是,把 a 转换为二进制,看看 bin(a) 的形式是否为一个“1”和若干个“0”构成,代码如下:
a = 8
b = str(bin(a))
total = 0
for i in range(2,len(b)):
total += int(b[i])
if total == 1 and b[2] == '1':
print('yes')
else:
print('no')
我们对代码进行解读。解读代码,就应该像这样,用中文的方式描述出代码的含义;这个要还是挺难的,要准确描述基础关键词
- 第 1~2 行,变量 a 为待判断的整数;变量 b 是 a 的二进制形式,并且被我们强制转化为 string 类型,这样 b 的值就是 0b1000。
- 如果形式为一个“1”和若干个“0”,则需要满足以下两个性质:第一,首位为“1”;第二,所有位加和为“1”。
- 在代码中,第 3~6 行,我们计算了所有位数的加和,并保存在 total 变量中。
- 在第 6~9 行,我们根据两个性质,对结果进行判断,并打印 yes 或者 no。
我们还可以利用位运算的“与”,来判断二进制数字 x 的形式是否为一个“1”和若干个“0”。判断的方法是,计算 x & (x-1),如果结果为 0 则是,如果结果为 1 则不是。位运算涉及哪些知识?
这样我们可以得到更简单的实现代码,代码如下:
a = 80
if a & (a-1) == 0:
print('yes')
else:
print('no')
小结
数制是数字的基础,也是计算机的基础。信息时代的到来,让二进制被广泛应用,这主要是因为电路中的开关只有接通和切断两种状态,二进制的运算也称为位运算。
计算机的数据存储单位便体现了数制的应用,计算机中的数据存储单位常常用 Byte(字节)或 bit(位)。
bit 是表示信息的最小单位,叫作二进制位,一个 bit 等于一个二进制数。一个十进制的数的比特要换成二进制看,比如十进制 31 换二进制是 11111 是 5 个 bit,32 换二进制是 100000 是 6 个 bit。而** Byte 叫作字节,用于表示计算机中的一个字符,是计算机文件大小的基本计算单位,1 Byte = 8 bit(也写作 1B = 8b),它采用了 8 个 2 进制位。**
在本课时中,我们学习不同数制之间的转换方法,包括换基法、除余法、按位拆分法和按位合并法。其中的换基法和除余法,是关于十进制的转换;而按位拆分法和按位合并法,则是关于二进制的转换。
在学习过程中,你会发现八进制和十六进制采用的按位合并法,更像是对二进制的压缩表示。八进制或十六进制的一个位,可以表示出 3 或 4 位的二进制数字。因此,用八进制或十六进制来表示二进制会更为方便。这是不是就是压缩和解压的基础原理?如果不是,那压缩的原理是啥?为什么压缩分那么多的格式呢?