预习非数值数据

非数值数据

非数值数据又称为字符数据,通常是指字符,字符串,图形符号和汉字等各种数据,它们不用来表示数值的大小,一般情况也不进行算术运算。ASCII为美国国家信息交换字符码。用七位二进制数表示一个字符。共128个。10个十进制数,52个英文大小写,34个专用字符和32个控制字符。汉字可以用国标码表示,也可以用区位码,以及机内码。汉字的字形码用来在点阵中显示汉字。

非数值数据的类型

1.逻辑值

将一个N位的数据看成是由N个1位数据组成,每个取值为1或0;有时需要存储一个布尔或二进制数据阵列,列阵中的每项只能取值1或0;有时需要提取一个数据项中的某位进行诸如“位置”或清零等操作。当数据以这种方式被看待时,就会被认为是逻辑数据。因此N位二进制数可表示N个逻辑值。逻辑数据只能参加逻辑运算,并且是按位进行的。逻辑数据和数值数据都是一串0/1序列,在形式上无任何差异,需要通过指令的操作码类型来识别它们。

2.西文字符

西文由拉丁字母、数字、标点符号及一些特殊符号所组成,它们统称为字符(character),所有字符的集合叫做字符集。字符不能直接在计算机内部进行处理,因而也必须对其进行47数字化编码,字符集中每一个字符都有一个代码(即二进制编码的0/1序列),构成了该字符集的代码表,简称码表。码表中的代码具有唯一性。字符主要用于外部设 备和计算机之间交换信息。一旦确定了所使用的字符集和编码方法后计算机内部所 表示的一进制代码和外部设备输人、打印和显示的字符之间就有唯的对应关系,字符集有多种,每个字符集的编码方法也多种多样。

3.汉文字符

汉字系统必须处理以下几种汉字代码:输入码、内码、字模点阵码。
汉字的输入码
汉字输入码也称外码,是为将汉字输入到计算机设计的代码。汉字输入码种类较多,选择不同的输入码方案,则输入的方法及按键次数、输入速度均有所不同。综合起来,汉字输入码可分为流水码、拼音类输入法、拼形类输入法和音形结合类输入法几大类。
字符集和汉字内码
西方字符:内码是ASCII

编码的区别

ASCII码:美国(国家)信息交换标准(代)码,一种使用7个或8个二进制位进行编码的方案,最多可以给256个字符
(包括字母、数字、标点符号、控制字符及其他符号)分配(或指定)数值。 
每个汉字有个二进制编码,叫汉字国标码。 每个汉字使用2个字节。 
GB2312-80 GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为
区号值和位号值加32(2OH),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94
区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计 3755个,置于16-55区,
按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而
 GB2312最多能表示6763个汉字。

效验码的方式

数据校验码
1.采用的思想是冗余校验的思想,即除原数据信息外,还增加若干位编码。
2.当数据被存入时对数据M进行运算,以产生相应的代码是P=F(M),这里P就校验码。
3.比较的结果
(1)没有检测到错误,得到的数据位直接传送出去
(2)检测到差错,并可以纠错。数据位和比较结果一起送入纠错器,然后将产生的正确的数据位传送过去
(3)检测到错误,但无法确认哪位出错,因而不能进行纠错处理,此时,报告出错情况。
4.由若干位代码组成的一个字叫码字,将两个码字逐位比较,具有不同代码的位的个数叫做这两个码字之间的距离,也称海明距离。
5.当d<=4时,关系如下:
(1)如果码距d位奇数,则能发现d-1位错,或者能纠正(d-1)/2位错。
(2)如果码距d位偶数,则能发现d/2位错,能纠正(d/2-1)位错。

奇偶效验码
1.是一种通过增加冗余位使得码字中"1"的个数恒为奇数或偶数的编码方法。
2.实现方法:在数据存储和传输中,字节中额外增加一个比特位,用来检验错误。校验位可以通过数据位异或计算出来。

海明效验码
1.将有效信息按某种规律分成若干组,每组安排一个校验位,做奇偶测试,就能提供多位检错信息,以指出最大可能是哪位出错,从而将其纠正。实质上,海明校验是一种多重校验。

循环冗余效验码
1.这种编码基本思想是将要传送的信息M(X)表示为一个多项式L,用L除以一个预先确定的多项式G(X),得到的余式就是所需的循环冗余校验码。
2.crc检验主要有计算法和查表法两种方法,网上很多实现代码。
3.优点①可检测出所有奇数位错;②可检测出所有双比特的错;③可检测出所有小于、等于校验位长度的突发错。

(1)对代码本体的每--位加权求和
设代码本体为C1、C2^ Cn, 权因子为P1、P2 Pn, 加权求和: S=Z Ci Pi。其中权因子可取自然数1, 2, 3, .几何级数2, 4,8,16, 32,.质数2,3,5,7,11,.,等等。
(2)以模除和得余数
R=Smod (M)
posted @ 2020-09-22 13:26  星星抓着月亮爬上太阳  阅读(881)  评论(0编辑  收藏  举报