摘要: 通用字符名 C也支持通用字符名来使用扩展字符集,使用通用字符名,你可以指定任何扩展字符,它的Unicode值如下形式: /uXXXX 或者: /UXXXXXXXX其中,XXXX或XXXXXXXX为16进制的Unicode指针符号,使用小写字母u做为前缀,后面为四个十六进制数字,或者大写字母U,后面为8个十六进制数字. 如果前四个十六进制数字为0,则也可以写作/uXXXX或者/U0000XXXX。 通用字符名可以用来表示标识符、字符常量、字符串,但是,不能用来表示基本字符集中的字符。 当你使用通用字符名来表示一个字符,编译器将它存储在字符集中,以便执行时使用。例如,如果执行时字符集在一个本地化程 阅读全文
posted @ 2010-12-01 00:25 Socrates 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 1.1.1 宽字符和多字节字符 C语言最初是在英文环境下发展而成,所以最初使用的是7位的ASCII编码字符集,其后,8位的字节变成最普遍的字符编码单位,但软件的国际化因素要求不能仅使用一个字节的字符编码方式,大量的不同与拉丁字母的多字节编码模式早已存在数十年,例如汉字、日文、韩文等。1994年,ISO C标准组织在“标准化附录1”中定义了两种大字符集:宽字符和多字节字符(一个字符可以使用一个或多个字节表示)。 自从1994年的附录开始,C不仅提供char类型,而且还提供宽字节字符wchar_t,这种类型定义在头文件stddef.h中,此文件足够大,以至于可以表示任意扩展字符集。 尽管C标准没有 阅读全文
posted @ 2010-12-01 00:17 Socrates 阅读(140) 评论(0) 推荐(0) 编辑