2.5非数值数据的编码表示
2.5.1西文字符
ASCLL码(美国标准信息交换码)
2.5.2汉字字符
汉字的输入码(外码)
每个汉字都用一个或者几个键来表示,这种对每个汉字用相应的按键进行的编码表示就称为汉字的输入码,又称外码。
字符集与汉字内码
汉字被输入到计算机内部后,就按照一种称为内码的编码形式在系统中进行存储、查找、传送等处理。
对于汉字内码的选择:
1.不能有二义性,即不能和ascll码有相同的编码。
2.要与汉字在字库中的位置有关系,以便于汉字的处理、查找。
3.编码应尽量短。
国标码(国际交换码)
共6763个常用汉字。
2.6数据的宽度和存储
1.二进制数据的每一位是组成二进制信息的最小单位,称为一个比特(bit),也称为位元,简称位。比特是计算机中处理、存储、传输信息的最小单位。
每个西文字符需要8个比特表示,每个汉字需要用16个比特表示。
2.二进制信息的计量单位是字节(byte),也成位组。一个字节==8个比特。
3.字长通常是指CPU内部用于整数运算的数据通路的宽度。
2.7数据校检码
1.方法大都采用冗余校验的思想,即除原数据信息外,还增加若干位编码,这些新增的代码称为校验位。
2.由若干位代码组成的一个字叫码字,将两个码字逐位比较,具有不同代码的位的个数叫做这两个码字间的距离,也称为海明距离。一种码制可能有若干个码字,各码字间的最小距离称为码距。
校验码的方式
1.奇偶校验码
2.海明校验码
3.循环冗余码