非数值数据的编码表示

一、逻辑值

①需要将一个n位数据看成由n个1位数据组成,每个取值为0或1,或需要提取一个数据项重得某位进行诸如“置换”或“清零”等操作时,这种数据就被认为是逻辑数据。
②逻辑数据和数值数据都是一串0/1序列,在形式上无差异,需要通过指令的操作码类型来识别它们。

二、西文字符

①西文由拉丁字母、数字、标点符号及一些特殊符号所组成,它们统称为字符。字符的集合叫字符集。
②字符集中每一个字符都有一个代码,构成了该字符的代码表。
③目前计算机中使用最广泛的西文字符集及其编码是ASCII码。

三、汉字字符

1.汉字的输入码

①对每个汉字用相应的按键进行的编码表示就成为汉字的输入码,又称为外码。
②因为汉字的输入码的码元(即组成编码的基本单位)是西文键盘中的某个按键。

2.字符集与汉字内码

对于汉字内码的选择,必须考虑以下几个因素:
①不能有二义性,即不能和ASCII码有相同的编码。
②要和汉字在字库中的位置有关系
③编码尽量短。

3.汉字的字模点阵码和轮廓描述

①字模点阵描述:将字库中每个汉字或其他字符的字形(即字模)用一个其元素有0和1组成的方阵来表示,汉字或字符中有黑点的地方用1表示,空白处用0表示。这种用来描述汉字字模的二进制点阵数据称为汉字的字模点阵码。
②轮廓描述方法:把汉字笔画的轮廓用一组直线和曲线来勾画,记下每一直线和曲线的数学表述公式。

数据的宽度和存储

四数据的宽度和单位

①二进制数据的每一位(0或1)是组成二进制信息的最小单位,称为一个比特(bit),或称位元,简称位。比特是计算机中处理、存储和传输信息的最小单位。
②在计算机内部,二进制信息的计量单位是字节(byte),也称位组。1 byte = 8 bit。
③字长等于CPU内部用于整数运算的运算器位数和通用寄存器宽度。
④字用来表示被处理信息的单位,用来度量各种数据类型的宽度;字长表示进行数据运算,存储和传送的部件的宽度,它反映了计算机处理信息的一种能力。

五、数据的存储和排列顺序

①一般用最低有效位(MBS)和最高有效位(LSB)分别表示数的最低位和最高位。
②字节有两种排序方式:大端和小端,大端方式将数据的最高有效字节MSB存放在低地址单元中,将最低有效字节LSB存放在高地址单元中,而小段则相反。

数据校验码

六、奇偶校验码

①是一种增加二进制传输系统最小距离的简单和广泛采用的方法。
二奇偶校验可描述为:给每一个码字加一个校验位,用它来构成奇性或偶性校验。可以看出,附加码元d2,是简单地用来使每个字成为偶性的。因此,若有一个码元是错的,就可以分辨得出,因为奇偶校验将成为奇性。
③奇偶校验编码通过增加一位校验位来使编码中1个个数为奇数(奇校验)或者为偶数(偶校验),从而使码距变为2。因为其利用的是编码中1的个数的奇偶性作为依据,所以不能发现偶数位错误。

七、海明校验码

①它不仅具有检测错误的能力,同时还具有给出错误所在准确位置的能力 但是因为这种海明校验的方法只能检测和纠正一位出错的情况。所以如果有多个错误,就不能查出了。
②CRC码的检错方法,校验位的生成,CRC码的纠错。

八、循环冗余校验码

①一种具有较强检错、纠错能力的校验码,常用于外存储器的数据校验,主要用于对大批量数据的存储或传输校验。
②可检测出所有奇数位错;可检测出所有双比特的错;可检测出所有小于、等于校验位长度的突发错。

重点难点

知识点太多了,学起来很抽象,好多搞不懂,最不懂的是数据校验码。