预习非数值数据的编码方式

2.5.1 逻辑值

例如：当存储一个布尔或二进制数据阵列，阵列中的每一项只能够取值为1或0；有时可能需要提取一个数据项中的某位进行诸如“置位”或“清零”等操作。当数据以这种方式看待时，被认为是逻辑数据。因此n位二进制数可表示n个逻辑值。逻辑数据只能参加逻辑运算，并且是按位进行，如按位“与”、按位“或”、逻辑左移、逻辑右移等。

2.5.2 西文字符

西文由拉丁字母、数字、标点符号及一些特殊符号所组成，它们统称为字符。所有字符的集合叫做字符集。字符不能直接在计算机内部进行处理，因而也必须对其进行数字化编码，字符集中每一个字符都有一个代码，构成该字符的代码表，简称码表。码表中的代码具有唯一性。字符主要用于外部设备和计算机之间交换信息。

2.5.3 汉字字符

1.汉字的输入法
2.字符集与汉字内码
3.汉字的字模点阵码和轮廓描述

非数值数据的类型

字符编码ASCII码

每个字符都由7个二进位b6b5b4b3b2b1b0表示，其中b6b5b4是最高位部分，b4b3b2b1b0是最低位部分。
在ASCII码值中，编码值0至31为控制字符，用于通信控制或设备的功能控制，编码127为DEL码，编码值32为空格sp，编码32至126共95个可印刷字符。48至57为0至9的ASCII码，取掉ASCII码48至57的二进制形式的前三位，剩下的恰好为0至9的二进制表示。

汉字的表示和编码

1.区位码
用两个字节表示一个汉字，每个字节用七位，并将汉字和图形符号排列在一个94行94列的二位代码表中。该编码用字符所在的区号和位号的二进制代码表示，7位区号在左，7位位号在右，共14位，这14位代码就叫汉字的区位码。
2.国标码
每个汉字的区号和位号必须各自加上32，这样的区号和位号各自加上32后的相应的二进制代码才是它的国标码，因此国标码的区号和位号还是各自占7位。
3.汉字内码
为了与ASCII码相区分，将国标码两个字节的最高位改为1，这就是汉字内码。
国标码=区位码（16）+2020H
汉字内码=国标码（16）+8080H

编码的区别

1.ASCII码：只能显示特殊字符，英文，数字。（8位 1字节表示1个字符）
2.万国码（Unicode编码）：最开始是十六位的中文不够32位四个字节占用的资源最多（unicode 32位 4个字节表示一个字符）
3.升级之后：UTF-8编码（一个汉字为三个字节） utf —16 utf—32（分别为8、16、32位一个字节）

  UTF-8编码          1个英文 8位，1个字节
 欧洲 16位   两个字节  表示一个字符
 亚洲 24位   三个字节  表示一个字符

4.GBK编码：（一个汉字为2个字节）中国国产的，只能用于中文和ASCII中的文字。（1个英文 8位，1个字节）

 亚洲 16位   两个字节  表示一个字符

校验码的方式

2.7.1奇偶校验码

在奇偶校验码中，若两个数据中有奇偶位不同，则它们相应的校验位就不同；若有偶数位不同，则虽校验位相同，但至少有两位数据位不同，因而任意两个码字之间至少有两位不同，所以码距d=2。奇偶校验码对整个数据编码生成一位校验位，因此校验码检错能力差，并且没有纠错能力。

最简单的数据校验方法：
第一步：在源部件求出奇（偶）校验位P
第二步：在目标部件求出奇（偶）校验位P'
第三步：计算最终的校验码P*，并将根据其值判断有无奇偶错

2.7.2海明校验码

海明校验码，其主要思想为：将数据按某种规律分成若干组，对每组进行相应的奇偶检测，以提供多位校验信息，从而可对错误位置进行定位，并将其纠正。实质上为一种多重奇偶校验码。

1.校验位的位数的确定
2.分组方式的确定
3.校验位的生成和检错、纠错

2.7.3循环冗余校验码

循环冗余检验码简称CRC码，是一种具有较强检错、纠错能力的校验码，常用于外存储器的数据校验，在计算机通信中也被广泛采用。

1.CRC码的检错方法
2.校验位的生成
3.CRC码的纠错

posted on 2020-09-22 13:32 杨阳young 阅读(326) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

杨阳young