为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。
国标码GB2312:(“国标”是中华人民共和国国家标准的简称)在中国大陆使用。GB2312只收录了6763个汉字,有不少汉字,如部分在GB 2312-80推出以后才简化的汉字(如“啰”),部分人名用字(如中国前总理***的“*”字),台湾及香港使用的繁体字,日语及朝鲜语汉字等,并未有收录在内,因此又制订了GBK编码。
GBK:全名为汉字内码扩展规范,K 即是“扩展”所对应的汉语拼音(KuoZhan)中“扩”字的声母,收录20912个汉字。
GB18030:收录27533个汉字,中华人民共和国国家标准总局于2000年推出的汉字编码标准,以取代GBK。
BIG5码。收录13053个汉字。在台湾和香港使用的一字节或两字节编码。
Unicode:该标准采用多(于一)个字节代表每一字符,实现了使用单个字符集代表世界上几乎所有书面语言。目前Unicode是采用16位编码体系,Unicode是完全双字节表示的多国文字编码体系,编码空间0x0000-0xFFFF,许使用65000个不同的字符。足以善盖世界所有语言的所有字母,外加数千种符号。使用UniCodes编码的软件,不会再有语言的编码冲突,在同屏下,可以显示任何语种的文字,大陆、台湾两岸文档可以直接交流,不用进行GB/BIG5转换,这就是Unicode的最大好处。使用Unicode编码的输入法,可以直接使用在简体中文、繁体中文、英文、日文等操作系统上。 Office中的“宋体-方正超大字符集”支持全部的GB18030汉字显示。