在汉字计算机编码标准中,目前最大的汉字编码是台湾的国家标准CNS11643,目前(4.0)共收录可考证之正简、日、韩语汉字共76,067个,在户政系统等官方机构普遍使用。台湾及港澳地区民间通用的大五码收录繁体汉字13053个。GB 18030是中华人民共和国现时最新的内码字集,总共收录70244个汉字;GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB 2312收录简体汉字6763个。而Unicode中日韩统一表意文字基本字集则收录汉字20902个,另有四个扩展区,总数亦高达七万多字。

 

汉字编码

汉字的基本字体:篆、隶、楷、行、草。本图还包括了书法和印刷的美术字体,前者如欧体、颜体,后者如宋体、黑体。

为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。

  • 国标码在中国大陆使用。GB 2312收录6763个汉字,GBK收录20912个汉字,最新的GB 18030-2005收录70244字(其中包括大量的东亚文字)。中国官方要求在中国大陆出售的软件必须支持GB 18030编码。
  • Big5码。收录13053个汉字。在台湾、港澳地区使用的一字节或两字节编码。
  • Unicode:在国际通信化和软件设计领域,中日韩统一表意文字编码收集了汉语日语朝鲜语/韩语中的汉字集。
  • 遵循创办人Michael Hart的古腾堡计划,以及坚信汉字是 地球人的文化遗产,秉持知识系统走向公平、公开、公共财的网络公民原则,EHGBooks微出版公司丘宏义博士带领薛丽珍总工程师等技术团队,应用曾荣获 台湾经济部创新系统软件大赛全国第三名的《古腾堡数字出版信息平台》(Gutenberg e-Book Server),发展云汉字的精密技术,2009年起展开对UNESCO联合国教育、科学及文化组织赞助美国国会图书馆旗下的世界数字图书馆(World Digital Library)提供专业的汉字译码信息服务,正式将汉字搬上世界文化的国际舞台。

 

from维基百科

posted on 2013-10-12 14:24  andy071001  阅读(993)  评论(0编辑  收藏  举报