编码笔记

一个字符在计算机中由8个二进制组成,则每个字符可表示256种不同的数值,即28种数值。

ASCII 编码:美国信息交换标准编码”的英文字头缩写,可称之为“美标”。美标规定了用从0到127的128个数字来代表信息的规范编码。其中包括33个控制码,一个空格码,和94个形象码。形象码中包括了英文大小写字母,阿拉伯数字,标点符号等。

由ASCII 编写的文件可以在不同的电脑间传递,则被称之为“美标文本文件”,即文本文件; ACSII只规定的0-127的编码其余的128个字符无规定,所编写的文件通常不能在不同的电脑间传递,则称之为“二进制文件”。

“国标”是“中华人民共和国国家标准信息交换用汉字编码”的简称。国标表(基本表)把七千余汉字、以及标点符号、外文字母等,排成一个94行、94列的方阵。方阵中每一横行叫一个“区”,每个区有九十四个“位”。一个汉字在方阵中的坐标,称为该字的“区位码”。

区位码 + 32 结果就是国标码(纯国标) [国标码会与ASCII的形象码重合,重合后相对应的美标符就称为“国标符”]

国标码 + 128 结果就是国标 (准国标)

GBK(K为扩的首写字母) 包含2万多的简繁汉字编码,称为《汉字内码扩展规范》(Chinese Internatial Code Specification)

GBK向下与GB-2312编码兼容,向上支持ISO 10646.1国际标准,是前者向后者过渡的一个承启标准。

posted @ 2012-01-30 16:19  challengesoflife  阅读(112)  评论(0编辑  收藏  举报