预习非数值数据的编码方式

预习非数值数据的编码方式(难点)

逻辑值表示:是逻辑数据的表示,只能参加逻辑运算。
西文字符表示:由拉丁字母,数字,标点符号以及一些特殊符号表示,他们统称字符

码表中的代码具有唯一性。

用汉字字符表示:包括汉字的输入码,和码,以及字符集和汉字内码。
汉字的字形主要有两种描述方法:字模点阵描述和轮廓描述。
字符集与汉字内码必须考虑的因素:
(1)不能和ASCII码有相同的编码。
(2)要与汉字在字库中的位置有关系,以便于汉字的处理、查找。
(3)编码应尽量短。

汉字数符

汉字的输入码(外码)

每个汉字都用一个或者几个键来表示,这种对每个汉字用相应的按键进行的编码表示就称为汉字的输入码,又称外码。

字符集与汉字内码

汉字被输入到计算机内部后,就按照一种称为内码的编码形式在系统中进行存储、查找、传送等处理。

数据校正码(重点)

奇偶效验码(对整个数据编码生成一个校验位)

奇偶效验根据数据的奇偶性变化来检错,只能检测奇数个错,不具有纠错能力
奇偶效验码常用于存储器读写检查或字节传输过程中的数据效验

海明效验码(多重奇偶校验码)

海明效验是分组奇偶效验,单纠错码(SCE)只能纠正一位错,“纠一检二”码(SEC-DED)可纠正一位错并检测两位数
效验位和故障字的位数是相同的
分组的确定:数据位和校验位一起存储,通过它们各位排列的码字中的出错位置与故障字的数值建立关系,这样就可以通过故障字的值找到该码字中的哪一位发生了错误
a.故障字各位全部为0,没有发生错误
b.故障字有且只有一位1.则只有一个发生错误,不需要纠正
c.故障字中多位为1,表示有一个数据位出错,其位置在码字中的位置通过故障字的数值确定,纠正只需要将出错位取反
校验码的生成和检错,纠错:对每组采用相应的奇偶校验,得到相应的一个校验码。
校验码若同时具有发现两位错和纠正一位错的能力,称为单纠错和双纠错码,简称“纠一检二”码

循环冗余效验码

简称CRS码,是一种具有较强检错、纠错能力的效验码,常用于外存储器的数据效验
循环冗余码效验通过某种数学运算在数据和效验位之间建立约定关系,主要用于对大批量数据的存储或传输效验

posted @ 2020-09-21 20:13  李文威  阅读(217)  评论(0编辑  收藏  举报