编码笔记
一个字符在计算机中由8个二进制组成,则每个字符可表示256种不同的数值,即28种数值。
ASCII 编码:美国信息交换标准编码”的英文字头缩写,可称之为“美标”。美标规定了用从0到127的128个数字来代表信息的规范编码。其中包括33个控制码,一个空格码,和94个形象码。形象码中包括了英文大小写字母,阿拉伯数字,标点符号等。
由ASCII 编写的文件可以在不同的电脑间传递,则被称之为“美标文本文件”,即文本文件; ACSII只规定的0-127的编码其余的128个字符无规定,所编写的文件通常不能在不同的电脑间传递,则称之为“二进制文件”。
“国标”是“中华人民共和国国家标准信息交换用汉字编码”的简称。国标表(基本表)把七千余汉字、以及标点符号、外文字母等,排成一个94行、94列的方阵。方阵中每一横行叫一个“区”,每个区有九十四个“位”。一个汉字在方阵中的坐标,称为该字的“区位码”。
区位码 + 32 结果就是国标码(纯国标) [国标码会与ASCII的形象码重合,重合后相对应的美标符就称为“国标符”]
国标码 + 128 结果就是国标 (准国标)
GBK(K为扩的首写字母) 包含2万多的简繁汉字编码,称为《汉字内码扩展规范》(Chinese Internatial Code Specification)
GBK向下与GB-2312编码兼容,向上支持ISO 10646.1国际标准,是前者向后者过渡的一个承启标准。