GBK又称GB扩展编码或GB13000,就是这样的一个汉字编码,它是是在兼容GB码的基础上,将GB码中不存在的ISO 10646.1汉字,按Unicode编码顺序进行重新编码。其编码空间包含几个子集,其中GBK/2就是GB码汉字;各子集的编码情况见下表。

      子集   编码范围      编码空间  编码字数
     =====  =============  ========  =========
     GBK/1  0xA1A1-0xA9FE     846         717
     GBK/2  0xB0A1-0xF7FE   6,768       6,763
     GBK/3  0x8140-0xA0FE   6,080       6,080
     GBK/4  0xAA40-0xFEA0   8,160       8,160
     GBK/5  0xA840-0xA9A0     192         166
     EUDC/1 0xAAA1-0xAFFE     564     用户定义1
     EUDC/2 0xF8A1-0xFEFE     658     用户定义2
     EUDC/3 0xA140-0xA7A0     672     用户定义3

Top GB BIG5 GBK


从上表可以看出,GBK共提供了23,940字的编码空间, 实际定义了 21,886汉字,可用户定义1,894汉字。双字节编码规则如下:

     第一字节  0x81-0xFE
     第二字节  0x40-0x7E, 0x80-0xFE;每行定义190汉字

Posted on 2006-09-16 10:16  古代  阅读(412)  评论(0编辑  收藏  举报