预习非数值数据的编码方式
非数值数据的编码表示
1.逻辑值
- 表示
用一位表示。n位二进制数可表示n哥逻辑值。 - 运算
按位进行。如按位“与”按位“或”“逻辑左移”“逻辑右移”等 - 识别
逻辑数据和数值数据在形式上无差别,都是遗传0/1序列,计算机靠指令来识别。
2.西文字符
- 特点
由拉丁字母,数字,标点符号及一些特殊符号组成
字符集中每一个字符都有一个代码(即二进制编码的0/1序列),构成了该字符集的代码表,简称码表。
128个常用字符,用7位二进制编码,最高位位0,从0到127
控制字符34个 普通字符94个 - 表示
常用编码为7位ASCII码
33.汉字字符
- 特点
汉字是表意文字,一个字就是一个方块图形。
汉字的总数超过6万字,数量巨大,给汉字在计算机内部的表示、汉字的传输与交换、汉字的输人和输出等带来了一系列问题。 - 表示
输入码:对汉字用相应按键进行编码表示,用于输入
内码:用于在系统中进行存储、查找、传送等处理
字模点阵或轮廓描述:描述汉字字模点阵或轮廓,用于显示/打印
数据的宽度和存储
1.数据的宽度和单位
- 基本宽度
比特,或称位元,简称位。 比特是计算机中处理、存储和传输信息的最小单位。
二进制信息最基本的计量单位是“字节”(Byet)
除比特和字节外,还经常使用“字”作为单位
“字”和“字长”的概念不同
“字长”指数据通路的宽度
“字”表示被处理信息的单位,用来度量数据类型的宽度 - 度量单位
容量经常使用单位
KB,1KB=1024B
MB,1MB=1024KB
GB,1GB=1024MB
TB,1TB=1024GB
通信中的带宽使用的单位
Kb/s, 1Kbs=1000bps
Mb/s, 1Mbs=1000Kbps
Gb/s, 1Gbs=1000Mbps
Tb/s, 1Tbs=1000Gbps
2、数据的存储和排列顺序
一般用最低有效位(LSB)和最高有效位(MSB)来分别表示数的最低位和最高位。对于带符号数,最高位是符号位,所以MSB就是符号位。
数据校验码
-
奇偶校验码
最简单的数据校验。在奇偶校验码中,若两个数据位不同,则他们的校验位就不同;若有偶数位不同,则虽校验位相同,但至少有两位数据位不同,因而任意两个码之间至少有两位不同。根据码距和检错/纠错能力的关系可知,他只能发现奇数位出错,不能发现偶数位出错,而且不能发现出错的位置,不具备纠错能力。但奇偶校验法所用的开销小,它常被用储存器读写检查或按字节传输过程中的数据校验,所以奇偶叫校验法用于校验字节长的代码还是有效的。 -
海明校验码
将数据按某种规律分成若干组,对每组进行相应的奇偶检测,以提供多位校验信息,从而可对错误位置进行定位,并将其纠正。海明校验码实质上就是一种多重奇偶校验码。 -
循环冗余校验码
循环冗余校验码是一种具有较强检错,纠错能力的校验码,常用于外存储器和计算机同步通信。奇偶校验码和海明校验码都是采用奇偶检测为手段检错和纠错的(奇偶校验码不具有纠错能力),而循环冗余校验则是通过某种数学运算来建立数据位和校验位的约定关系的。