预习非数值数据的编码方式
非数值数据的类型:
非数值数据的类型:逻辑值,西文字符,中文字符。
逻辑值
1.逻辑数据和数值数据一般都是一串0/1序列,在形式上无差异,需要通过指令的操作码类型来识别它们;
2.逻辑运算指令处理的是逻辑数据,算术运算指令处理的是算数数据。
西文字符
1.西文字符由拉丁字、数字、标点符号及一些特殊符号组成,它们统称字符,所有字符的集合叫做字符集。
2.最广泛的字符集及其编码是ASCLL码。
3.字符0-9这10个数字字符的高三位编码为011,低4位分别是0000-1001;当去掉高3位时,低4位正好是0-9这10个数字的8421码。
4.英文字母字符的编码值也满足正常的字母排序关系,而且大、小写字母的编码之间有简单的对应关系,差别仅在b5这一位上,若这一位为0,则是大写字母;若为1,则是小写字母。
汉字字符
1.汉字被输入到计算机内部后,就按照一种称为内码的编码形式在系统中进行存储、查找、传送等处理。
2.汉字的输入码的码元是西文键盘中的某个按键。
3.汉字内码必须考虑的几个因素:
(1).不能有二义性,即不能和ASCLL码有相同的编码。
(2).要与汉字在字库中的位置有关系,以便于汉字的处理、查找。
(3).编码应尽量短。
编码的区别
1.ASCII 码 2.GBK编码 3.Unicode编码 4.UTF-8编码
校验码的方式
<1>奇偶校验码
这是最简单的校验方式,在信息编码的时候,将字的最高位作为校验位。需要说明的事奇偶校验也有两种校验方式:奇校验和偶校验。
奇校验:在最高位添加0或1,使字编码中的“1”的个数为奇数。
偶校验:在最高位添加0或1,使字编码中的“1”的个数为偶数。
校验特点:一次能校验更多的数据,效率较高,系统实现也比较简单,检测可靠性有所提高,但仍然不能检测出所有的错误。
<2> 海明校验码
明校验是一种多重校验, 将有效信息按某种规律分成若干组,每组安排一个校验位,做奇偶测试,就能提供多位检错信息,以指出最大可能是哪位出错。假设k个数据位设置r个校验位,则应满足:
^r>=k+r+1
校验位分布20,21,22...2n位上
<3>循环冗余效验码
简称CRS码,是一种具有较强检错、纠错能力的效验码,常用于外存储器的数据效验
循环冗余码效验通过某种数学运算在数据和效验位之间建立约定关系,主要用于对大批量数据的存储或传输效验