#信息层读书笔记
---恢复内容开始---
信息层读书笔记
第2章 二进制数值与记数系统
2.1 数字与计算
- 数字:属于抽象数学系统的一个单位,服从特定的顺序法则、加法法则和乘法法则,其包括自然数、负数、有理数、无理数等。
- 自然数(natural number):0或通过在0上重复加1得到的任何数。
- 负数(negative number):小于0的数,是在相应的正数前加负号得到的数。
- 整数(integer):自然数、自然数的负数或0。
- 有理数(rational number):整数或两个整数的商。
2.2 位置记数法
- 基数:记数系统的基本数值,规定了这个系统中使用的数字量和数位位置的值
- 位置计数法:一种表达数字的系统,数位按顺序排列,每个数位有一个位值,数字的值是每个数位和定值的乘积之和。
- 0的重要性:0的发现给了人类思想无限的潜力,没有其他的人类创新可以给人类智能的发展带来如此深远的影响。 ——Georges Ifrah
2.2.1 二进制、八进制和十六进制
注意:任何记数系统中的最大数字比基数小1,比如,以10为基数的记数系统具有十个数字(0-9)。
二进制、八进制和十六进制转换成十进制数所执行的操作完全一样
2.2.2 其他记数系统中的运算
- 二进制加法中需要注意“进位”的使用方法
- 二进制减法中需要注意“借位”的使用方法
- 通过对比发现二进制运算的规则与十进制运算的很类似
2.2.3 以2的幂为基数的记数系统
1.把二进制数转换成八进制数,要从最右边的二进制数位开始,每三个数位一组,把每组数字转换成相应的八进制数。
2.二进制数和八进制数之间可以快速转换的原因在于8是2的幂(在二进制和十六进制之间也存在类似的关系)
3.表示一位十六进制数需要四位二进制数
2.2.4 把十进制数转换成其他数制的数
- 转换十进制数的规则涉及新基数的除法。
-
如果用另一种形式来描述
While(商不是0)
用新基数除这个十进制数
把余数作为答案左边的下一个数字
用商代替这个十进制数
2.2.5 二进制数值与计算机
- 二进制数字(binary digit):二进制记数系统中的一位数字,可以是0或1。
- 位(bit):二进制数字的简称。
- 字节(byte):8个二进制位。
- 字(word):一个或多个字节,字中的位数称为计算机的字长。
小结
- 1.数是用位置记数法编写的,其中数字按顺序排列,每个数字具有一个位值,数值等于每个数字与它的位值的乘积之和。
- 2.位值是记数系统的基数的幂。
- 3.计算机硬件采用的是二进制数。
第3章 数据表示法
3.1 数据与计算机
- 数据(data):基本值或事实。
- 信息(information):用有效的方式组织或处理过的数据。
-
计算机可以存储、表示和帮助我们修改各种类型的数据,包括:
*数字
*文本
*音频
*图像和图形
*视频 - 多媒体(multimedia):几种不同的媒体类型。
- 带宽(bandwhich):在固定时间内从一个地点传输到另一个地点的最大位数或字节数。
- 数据压缩(data compression):减少存储一段数据所需的空间。
1.压缩率(compression ratio):压缩后的数据大小除以原始数据大小的值。
2.有损压缩(lossy compression):会丢失信息的数据压缩技术。
3.无损压缩(lossless compression):不会丢失信息的数据压缩技术。
3.1.1 模拟数据与数字数据
- 自然界的大部分都是连续的和无限的。
- 表示数据的两种方法:模拟法和数字法
- 模拟数据(analog data):用连续形式表示的信息。
- 数字数据(digital data):用离散形式表示的信息。
- 数字化(digitize):把信息分割成离散的片段。
-
为什么现代计算机使用和管理的都是二进制数值?
因为如果存储和管理数据的设备只需要表示两种数值之一,那么费用要小得多,而且也可靠得多。如果电信号只传输二进制数据,也易于维护。 - 脉冲编码调制(pulse-code modulation):电信号在两个极端之间跳跃的变化。
- 重新计时(reclock):在信号降级太多之前将它重置为原始状态的行为。
注意:只要在信号降级太多之前重新计时,就不会丢失信息。
3.1.2 二进制表示法
- 一般来说,n位二进制数字能表示2^n种状态,因为n位数字可以构成2^n种0和1的组合。
注意:每当可用的位数增加一位,可以表示的状态的数量就会多一倍。 - 计算机体系结构一次能够寻址和移动的位数有一个最小值,通常是2的幂,如8、16或32位。
因此,分配给任何类型的数据的最小存储量通常是2的幂的倍数。
3.2 数字数据表示法
3.2.1 负数表示法
- 符号数值表示法(signed-magnitude representation):符号表示数所属的分类(正数或负数)、值表示数的量值的数字表示法。
*对带符号的整数执行加法和减法操作可以被描述为向一个方向或另一个方向移动一定的数字单位。 - 定长量数
在这种模式下执行加法,只需要对两个数求和,然后舍弃进位即可,所以该模式引出了十进制补码的概念。
十进制补码(ten’s complement):一种负数表示法,负数I用10的k次幂减I表示。 - 二进制补码
注意:如果数的最左边一位是“0”,那么说明这个数字是正数;如果是“1”说明这个数字是负数。
一个更简单的方法来计算二进制补码:将每一位取反再加一。 优点:使你可以在二进制补码中立刻识别出一个数是正数还是负数。 - 溢出(overflow)::给结果预留的位数存不下计算出的值的状况。
溢出问题: 溢出是无限的世界映射到有限的机器上会发生的典型问题。无论给一个数字分配多少位,总有潜在的表示这些位不能满足的数的需要。
3.2.2 实数表示法
- 实数具有整数部分和小数部分。
- 小数点(radix point):在记数系统中,把一个实数分割成整数部分和小数部分的点。
注意:在十进制中,小数点右侧的位置是十分位、百分位,依次类推;在二进制中,小数点右侧的位置是二分位、四分位,依次类推。 - 实值:非整数的值。
任何实值都可以由符号(正号或负号)、尾数和指数 - 浮点表示法(floating point):标明了符号、尾数和指数的实数表示法。
十进制的实值的公式定义:符号×尾数×10^exp
二进制的实值的公式定义:符号×尾数×2^exp - 科学记数法(scientific notation):另一种浮点表示法。
3.3 文本表示法
- 字符集(character set):字符和表示它们的代码的清单。
3.3.1 ASCII字符集
- 最初的ASCII字符集用7位表示每个字符,可以表示128个不同的字符。每个字节中的第八位最初被用作校验位。后来的Latin-1扩展ASCII字符集可以表示256个字符,包括一些重点字符和几个补充的特殊符号。
注意:每个ASCII字符都有自己的顺序,这是由存储它们所用的代码决定的。
3.3.2 Unicode字符集
- 创建者目标:表示世界上使用的所有语言中的所有字符,包括亚洲的表意符号,此外,它还表示了许多补充的专用字符,如科学符号。
注意:Unicode字符集的一个方便之处就是它把ASCII字符集作为了一个子集。也可以说Unicode字符集被设计为ASCII的超集。
3.3.3 文本压缩
- 字母信息(文本)是一种基本数据类型。
- 关键字编码(keyword encoding):用单个字符代替常用的单词。
一.关键字编码的局限性:1.用来对关键字编码的字符不能出现在原始文本中。2.限制了能够编码的单词数和要编码的文本特性
二.关键字编码的一种扩展是用特殊字符替换文本中的特定模式。
三.关键字编码的优点是被编码的模式通常比整个单词出现的频率更高;但缺点是被编码的通常是比较短的模式,对每个单词来说,替换它们节省的空间比较少。 - 行程长度编码(run-length encoding):把一系列重复字符替换为它们重复出现的次数。 别称:迭代编码
注意: 在行程长度编码中,重复字符的序列将被替换为标志字符,后面加重复字符和说明字符重复次数的数字。 - 赫夫曼编码(Huffman encoding):用变长的二进制串表示字符,使常用的字符具有较短的编码。
3.4 音频数据表示法
- 一个立体声系统通过把电信号发送到一个扬声器来制造声音。这种信号是声波的模拟表示法。
- 一般说来,采样率在每秒40000次左右就足够创建合理的声音复制品。采样率高于这个值,人耳听到的声音就会失真。
- 声音的整体效果是受很多因素影响的,包括设备的质量、声音的类型和人的听力等。
- 塑料唱片是声波的模拟表示法 。
3.4.1 音频格式
- 流行的音频数据格式:WAV、AU、AIFF、VQF和MP3等。
注意:尽管所有格式都是基于从模拟信号采样得到的电压值的,但是它们格式化信息细节的方式不同,采用的压缩技术也不同。
3.4.2 MP3音频格式
- MP3格式使用有损压缩和无损压缩两种压缩方法。
3.5.1 颜色表示法
- 颜色通常用RGB(red-green-blue)值表示,这其实是三个数字,说明了每种原色的相对份额。
- 色深度:用于表示颜色的数据量,通常用表示颜色的位数来表示色深度。
- 增强彩色:是指色深度为16位的颜色。
- 真彩色:是指色深度为24位的颜色。
3.5.2 数字化图像与图形
- 像素(pixel):用于表示图像的独立点,代表图像的元素。
- 分辨率(resolition):用于表示图像的像素个数。
- ** 光栅图形格式(raster-graphics format):逐个像素存储图像信息的格式。
目前流行的几种光栅图形格式有 位图(BMP)、 GIF和 JPEG。
一.GIF图像只能由256**种颜色构成,GIF文件最适合用于颜色较少的图形和图像,因此它是 存放线条图像的 首选格式。
二.JPEG利用了人眼的特性,它被看作 存储照片颜色图像的首选格式。它采用的压缩模式相当复杂,有效地减少了生成地文件大小。
三.PNG图像的压缩效果通常比GIF图像的更好,同时提供的色深度范围也更广。不过,PNG图像不支持动画,也不像GIF格式那样广受支持。
3.5.3 图形的矢量表示法
- 矢量图形(vector graphics):用线段和几何形表示图像的方法。它也是一系列描述线段的方向、线宽和颜色的命令。
- 光栅图形与矢量图形的对比:光栅图形要获得不同的大小和比例必须进行多次编码,矢量图形则可以通过数学计算调整大小,这些改变可以根据需要动态地计算。
但是,矢量图形不适合于表示 真实世界的图像。 - 网上最流行的矢量图形格式是Flash,它的图像存储为二进制格式,创建Flash图像需要专用的编辑器。
3.6 视频表示法
- 视频编译码器(video codec):用于缩减电影大小的方法,使电影能够在计算机或网络上播放。
- 视频编译码器采用的压缩方式: 时间压缩和 空间压缩。
一.时间压缩(temporal compression):根据连续帧之间的差别压缩电影的技术。
二.空间压缩(spatial compression):基于静态图像的压缩技术的电影压缩技术。
注意:1.关键帧是比较帧之间差别的参照物,它的完整图像都会被保存。2.对于连续的图像,只保存改变的部分( 增量帧)。 - 当今流行的视频编译码器:Sorenson、Cinepak、MPEG和Real Video。
小结
一.由于计算机只能操作二进制数值,所以所有类型的数据都必须表示为二进制形式。
二.数据可以分为两类:连续的(模拟的)和 离散的(数字的)。
三.整数值由它们对应的二进制值表示,负数的表示方法有符号数值表示法和 补码表示法。
四.字符集是字母与 数字字符以及表示它们的代码的清单。
五.音频信息被表示为数字化的声波。
六.表示图像的基本方法有位图和 矢量图形。
七.视频被分割成了一系列表示为图像的静态图像。
---恢复内容结束---