预习非数值数据的编码方式

一、逻辑值

1.n位二进制数可表示n个逻辑值

2.逻辑数据只能参加逻辑运算,并且是按位进行的。

3.逻辑数据和数值数据都是一串0/1序列,需要通过指令的操作码类型来识别他们。

二、西文字符

1.西文由拉丁字母和数字,标点符号及一些特殊符号所组成,通称字符,集合叫字符集。

2.字符集中每一个字都有一个代码,构成该字符集的代码表,简称码表,码表的代码具有唯一性。

3.字符用于外部设备和计算机之间交换信息,字符集有多种,每个字符集编码方法也多种多样,目前最广泛的字符集及其编码是ASCII码

三、汉字字符

1.汉字的输入码:由于汉字字数多,无法使每个汉字和键盘的一个键对应,需要一个或多个键表示,这种对每个汉字用相应的按键进行的编码表示就是汉字的输入码,又称外码。所以码元就是西文键盘的某个按键

2.字符集与汉字内码:对于汉字内码的选择要考虑以下的几种因素:(1)不能有二义性。(2)要与汉字在字库中的位置有关系,便于处理查找。(3)编码尽量短

为了适应计算机处理汉字信息的需要,我国颁布了GB2312国际字符集:码表94行,94列组成,行号称为区号,列号称为位号。汉字的位置由区位码表示。

编码的区别

数据的宽度和单位

比特(bit):计算机内部信息由二进制编码表示,数据的每一位是组成二进制的最小单位为比特,或称元,简称位。比特是计算机中处理储存,传输信息的最小单位。

字节(byte):每个西文字符要8个比特表示,而汉字要16个。二进制信息的计量单位是字节,也叫位组。一个字节等于8个比特

word也是一个单位,还有不同计算机的字的长度和组成不完全相同。

字是度量各种数据类型的宽度,字长是进行数据运算传输传送的部件的宽度

数据的储存和排列顺序

最低有效位(LSB)和最高有效位(MSB)来分别数的最低位和最高位。对于带符号的数,最高位是符号位。

大端方式将数据的最高有效字节MSB存放在低地址单元中,将最低有效字节LSB存放在高地址单元中,小端与之相反

数据校验码

1.奇偶校验码

最简单的数据校验方法是奇偶检验,所用开销小,常被用于存储器读写检查或字节传输过程中的数据校验。

2.海明校验码

利用奇偶性来校验数据的. 它是一种多重奇偶校验检错系统,它通过在数据位之间插入k个校验位,来扩大码距,从而实现检错和纠错。

(1)假设用N表示添加了校验码位后整个信息的二进制位数,用K代表其中有效信息位数,r表示添加的校验码位,它们之间的关系应满足:N=K+r≤2……r-1。

(2)分组方式的确定:在海明码中, 位号数(1、2、3、……、n)为2的权值的那些位,即:

1(20)、2(21)、4(22)、8(23)、…2r-1位,作为奇偶校验位
并记作: P1、P2、P3 、P4、…Pr,余下各位则为有效信息位。
例如: N=11 K=7 r=4 相应海明码可示意为
位号 1 2 3 4 5 6 7 8 9 10 11
P占位 P1 P2 × P3 × × × P4 × × ×
其中×均为有效信息,海明码中的每一位分别被P1P2P3P4… Pr 中的一至若干位所校验,其规律是:
第i位由校验位位号之和等于i的那些校验位所校验
如:海明码的位号为3,它被P1P2(位号分别为1,2)所校验
海明码的位号为5,它被P1P3(位号分别为1,4)所校验
归并起来: 形成了4个小组,每个小组一个校验位,校验位的取值,仍采用奇偶校验方式确定。

(3)校验码的生成和检错,纠错

3.循环冗余校验码

简称CRC码,常用于外存储器的数据检验,在计算机通信中也被广泛使用。

 
 
posted @ 2020-09-21 21:02  不爱回信息的小佳  阅读(205)  评论(0编辑  收藏  举报