杨阳young

预习非数值数据的编码方式

预习非数值数据的编码方式

2.5.1 逻辑值

例如:当存储一个布尔或二进制数据阵列,阵列中的每一项只能够取值为1或0;有时可能需要提取一个数据项中的某位进行诸如“置位”或“清零”等操作。当数据以这种方式看待时,被认为是逻辑数据。因此n位二进制数可表示n个逻辑值。逻辑数据只能参加逻辑运算,并且是按位进行,如按位“与”、按位“或”、逻辑左移、逻辑右移等。

2.5.2 西文字符

西文由拉丁字母、数字、标点符号及一些特殊符号所组成,它们统称为字符。所有字符的集合叫做字符集。字符不能直接在计算机内部进行处理,因而也必须对其进行数字化编码,字符集中每一个字符都有一个代码,构成该字符的代码表,简称码表。码表中的代码具有唯一性。字符主要用于外部设备和计算机之间交换信息。

2.5.3 汉字字符

1.汉字的输入法
2.字符集与汉字内码
3.汉字的字模点阵码和轮廓描述

非数值数据的类型

字符编码ASCII码

每个字符都由7个二进位b6b5b4b3b2b1b0表示,其中b6b5b4是最高位部分,b4b3b2b1b0是最低位部分。
在ASCII码值中,编码值0至31为控制字符,用于通信控制或设备的功能控制,编码127为DEL码,编码值32为空格sp,编码32至126共95个可印刷字符。48至57为0至9的ASCII码,取掉ASCII码48至57的二进制形式的前三位,剩下的恰好为0至9的二进制表示。

汉字的表示和编码

1.区位码
用两个字节表示一个汉字,每个字节用七位,并将汉字和图形符号排列在一个94行94列的二位代码表中。该编码用字符所在的区号和位号的二进制代码表示,7位区号在左,7位位号在右,共14位,这14位代码就叫汉字的区位码。
2.国标码
每个汉字的区号和位号必须各自加上32,这样的区号和位号各自加上32后的相应的二进制代码才是它的国标码,因此国标码的区号和位号还是各自占7位。
3.汉字内码
为了与ASCII码相区分,将国标码两个字节的最高位改为1,这就是汉字内码。
国标码=区位码(16)+2020H
汉字内码=国标码(16)+8080H

编码的区别

1.ASCII码:只能显示特殊字符,英文,数字。(8位 1字节 表示1个字符)
2.万国码(Unicode编码):最开始是十六位的 中文不够32位 四个字节 占用的资源最多(unicode 32位 4个字节 表示一个字符)
3.升级之后:UTF-8编码(一个汉字为三个字节) utf —16 utf—32(分别为8、16、32位一个字节)

  UTF-8编码          1个英文 8位,1个字节
 欧洲 16位   两个字节  表示一个字符
 亚洲 24位   三个字节  表示一个字符

4.GBK编码:(一个汉字为2个字节)中国国产的,只能用于中文和ASCII中的文字。(1个英文 8位,1个字节)

 亚洲 16位   两个字节  表示一个字符

校验码的方式

2.7.1奇偶校验码

在奇偶校验码中,若两个数据中有奇偶位不同,则它们相应的校验位就不同;若有偶数位不同,则虽校验位相同,但至少有两位数据位不同,因而任意两个码字之间至少有两位不同,所以码距d=2。奇偶校验码对整个数据编码生成一位校验位,因此校验码检错能力差,并且没有纠错能力。

最简单的数据校验方法:
第一步:在源部件求出奇(偶)校验位P
第二步:在目标部件求出奇(偶)校验位P'
第三步:计算最终的校验码P*,并将根据其值判断有无奇偶错

2.7.2海明校验码

海明校验码,其主要思想为:将数据按某种规律分成若干组,对每组进行相应的奇偶检测,以提供多位校验信息,从而可对错误位置进行定位,并将其纠正。实质上为一种多重奇偶校验码。

1.校验位的位数的确定
2.分组方式的确定
3.校验位的生成和检错、纠错

2.7.3循环冗余校验码

循环冗余检验码简称CRC码,是一种具有较强检错、纠错能力的校验码,常用于外存储器的数据校验,在计算机通信中也被广泛采用。

1.CRC码的检错方法
2.校验位的生成
3.CRC码的纠错

posted on 2020-09-22 13:32  杨阳young  阅读(326)  评论(0编辑  收藏  举报

导航