摘要: 全国信息技术标准化技术委员会        汉字内码扩展规范(GBK)    Chinese Internal Code Specification            1.0 版         (按编码顺序排列)81 0 1 2 3 4 5 6 7 8 9 A B C D E F4 丂 丄 丅 丆 丏 丒 丗 丟 丠 両 丣 並 丩 丮 丯 丱5 丳 丵 丷 丼 乀 乁 乂 乄 乆 乊 乑 乕 乗 乚 乛 乢6 乣 乤 乥 乧 乨 乪 乫 乬 乭 乮 乯 乲 乴 乵 乶 乷7 乸 乹 乺 乻 乼 乽 乿 亀 亁 亂 亃 亄 亅 亇 亊8 亐 亖 亗 亙 亜 亝 亞 亣 亪 亯 亰 亱 亴 阅读全文
posted @ 2010-01-31 23:06 Max Woods 阅读(10062) 评论(0) 推荐(0) 编辑
摘要: 由于常常要和汉字处理打交道,因此,我常常受到汉字编码问题的困扰。在不断的打击与坚持中,也积累了一点汉字编码方面的经验,想和大家一起分享。 一、汉字编码的种类 汉字编码中现在主要用到的有三类,包括GBK,GB2312和Big5。 1、GB2312又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆。新加坡等地也使用此编码。它是一个简化字的编码规范,当然也包括其他的符号、字母、日文假名等... 阅读全文
posted @ 2010-01-31 23:02 Max Woods 阅读(281) 评论(0) 推荐(0) 编辑
摘要: In order to produce the mapping tables for this book, I wrote the following Java program, GB2312Unicode.java. The output of this program is presented in the next 3 chapters. /** * GB2312Unicode.java *... 阅读全文
posted @ 2010-01-31 22:57 Max Woods 阅读(403) 评论(0) 推荐(0) 编辑
摘要: 一、汉字编码的种类 1、GB2312又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆。新加坡等地也使用此编码。它是一个简化字的编码规范,当然也包括其他的符号、字母、日文假名等,共7445个图形字符,其中汉字占6763个。我们平时说6768个汉字,实际上里边有5个编码为空白,所以总共有6763个汉字。 GB2312规定“对任意一个图形字符都采用两个字节表示,每个字节... 阅读全文
posted @ 2010-01-31 22:56 Max Woods 阅读(5303) 评论(0) 推荐(0) 编辑
摘要: 中华人民共和国国家标准 信息交换用汉字编码字符集 基 本 集 GB 2312-8001 0 1 2 3 4 5 6 7 8 90     、 。 · ˉ ˇ ¨ 〃 々1 — ~ ‖ … ‘ ’ “ ” 〔 〕2 〈 〉 《 》 「 」 『 』 〖 〗3 【 】 ± × ÷ ∶ ∧ ∨ ∑ ∏4 ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠ ⌒ ⊙5 ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯6 ≤ ≥ ∞ ∵ ∴ ♂ ♀ ° ′ ″7 ℃ $ ¤ ¢ £ ‰ § № ☆ ★8 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※9 → ← ↑ ↓ 〓02 0 1 2 3 4 5 6 7 8 90   ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ 阅读全文
posted @ 2010-01-31 22:52 Max Woods 阅读(4341) 评论(0) 推荐(0) 编辑