CHAR ENCODING - 随笔分类 - IAmAProgrammer

UCS UTF UTF-7 UTF-8 UTF-16

摘要：Unicode也是一种字符编码方法，不过它是由国际组织设计，可以容纳全世界所有语言文字的编码方案。Unicode的学名是"Universal Multiple-Octet Coded Character Set"，简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。U... 阅读全文

posted @ 2015-05-13 23:07 IAmAProgrammer

Code Pages Supported by Windows

摘要：所谓代码页 (codepage) 就是各国的文字编码和 Unicode 之间的映射表。例如 GBK 和 Unicode 的映射表就是 CP936，所以也常用 cp936 来指代 GBK。Code Pages Supported by WindowsThe lists below provide links to graphical representations and textual listings of each of the Windows codepages.SBCS (Single Byte Character Set) Codepages1250 (Central Europe) 阅读全文

posted @ 2013-05-13 03:04 IAmAProgrammer

unicode control and basic latin - ASCII

摘要：阅读全文

posted @ 2013-05-12 19:39 IAmAProgrammer

The Unicode Range and Viewer

摘要：http://www.russellcottrell.com/greek/utilities/UnicodeRanges.htmtypedef struct{ uint32_t FristCode; uint32_t LastCode; uint8_t * Description;} UNICODE_RANGE_T;const UNICODE_RANGE_T UnicodeRange[ ] ={{ 0x0000, 0x007F, "Basic Latin" },{ 0x0080, 0x00FF, "Latin, 0x1 Supplement" },{ 0 阅读全文

posted @ 2013-05-12 19:30 IAmAProgrammer

中文字符编码 GB2312 GBK GB18030 BIG5 UNICODE UTF8 UTF16 UTF-32 USC-2 UCS-4

摘要：信息交换用汉字编码字符集·基本集 GB2312概述GB 2312或GB 2312-80是中国国家标准简体中文字符集，全称《信息交换用汉字编码字符集·基本集》，又称GB0GB 2312标准共收录6763个汉字，其中一级汉字3755个，二级汉字3008个；同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个字符。GB 2312的出现，基本满足了汉字的计算机处理需要，它所收录的汉字已经覆盖中国大陆99.75%的使用频率。对于人名、古汉语等方面出现的罕用字，GB 2312不能处理，这导致了后来GBK及GB 18030汉字字符集的出现。分区表示GB 阅读全文

posted @ 2013-05-07 20:38 IAmAProgrammer

随笔分类 - CHAR ENCODING