Windows Unicode

所有的 Unicode 函数均已 wcs 开头

TChar.h 头文件：

作用就是帮助创建 ANSI / Unicode 通用的源代码文件 , 它包含了用在源代码中的一组宏定义
例如 : _tcscpy 宏 , 如果在包含该头文件时没有定义 UNICODE ,那么 _tcscpy 会扩展为 ANSI 的 strcpy 函数 , 如果
定义了 UNICODE 那么就会扩展为 wcscpy 函数

拥有字符串参数的所有 C 运行期函数都在 TChar.h 文件中定义了一个通用宏

L"字符串" :

字符串前面加大写的字母 L , 用于告诉编译器该字符串应该作为 Unicode 字符串来编译 , 当编译器将字符串置于程序的数据部分中时
,会在每个字符之间分散插入零字节 . 这种变更带来的问题是 , 现在只有定义了 UNICODE 时,程序才能编译通过

_TEXT("字符串") :

有选择的是否按照 UNICODE 来编译字符串 , 根据是否定义了 UNICODE 来存储字符串 ,不会跟 L 一样 , 都分散插入零字节

Unicode 数据类型 :

WCHAR Unicode字符

PWSTR 指向 Unicode 字符串的指针

PCWSTR 指向一个恒定的 Unicode 字符串指针

这些数据类型是值 Unicode 字符和字符串 , Windows 头文件也定义了 ANSI / Unicode 通用的数据类型 PTSTR 和 CTSTR

成为符号 ANSI 和 Unicode 的应用程序基本原则:

1 将文本串视为字符数组 , 而不是 chars 数组或字节数组

2 将通用数据类型 (如 TCHAR 和 PTSTR) 用于文本字符和字符串

3 将显示数据类型 (如 BYTE 和 PBYTE) 用于字节 , 字节指针和数据缓存

4 将 TEXT 宏用于原义字符和字符串

5 执行全局性替换 (例如用 PTSTR 替换 PSTR)

6 修改字符串运算问题 . 例如函数通常希望你在字符中传递一个缓存的大小 , 而不是字节 . 这就意味着你不应该传递 sizeof(szBuffer) ,
而是应该传递 (sizeof(szBuffer)/sizeof(TCHAR)) . 另外 , 如果需要为字符串分配一个内存块 , 并且拥有该字符串中的字符数目 ,
那么请记住要按字节来分配内存 , 也就是说应该调用 malloc(nCharacters * sizeof(TCHAR)) 而不是 malloc(nCharacters)

对 Unicode 字符串进行操作的函数 :

lstrcat 将一个字符串置于另一个字符串的结尾处

lstrcmp 对两个字符串进行区分大小写的比较

lstrcmpi 对两个字符串进行不区分大小写的比较

lstrcpy 将一个字符串拷贝到内存中的另一个位置

lstrlen 返回字符串的长度 (按字符数来计量)

这些函数是作为宏来实现的 , 这些宏既可以调用函数的 Unicode 版本 , 也可以调用 ANSI 版本

CompareString 函数 :

int CompartString(

LCID lcid, //本机使用的语言 ID LCID = GetThreadLocal(); 函数可以获取本机使用的语言 ID

// NORM_IGNORECASE 忽略字母的大小写
// NORM_IGNOREKANATYPE 不区分平假名与片假字符
// NORE_IGNORENONSPACE 忽略无间隔字符
// NORE_IGNORESYMBOLS 忽略符号
// NORM_IGNOREWIDTH 不区分单字节字符与作为双字节字符的同一个字符
// SORT_STRINGSORT 将标点符号作为普通符号来处理
DWORD fdwStyle, //标志用来修改该函数比较两个字符串所用的方法

PCWSTR pString1, //要比较的字符串 1

int cch1, //要比较字符串 1 的长度 , 如果为 -1 表名字符串1 以 0 结尾 ,函数会自动计算字符串 1 的长度

PCWSTR pString1, //要比较的字符串 2

int cch1, //要比较字符串 2 的长度 , 如果为 -1 表名字符串2 以 0 结尾 ,函数会自动计算字符串 2 的长度
)

Unicode 字符的串大小写字母:

PTSTR CharLower(PTSTR pszString); //转换成小写字母

PTSTR CharUpper(PTSTR pszString); //转换成大写字母

// Unicode 转换缓存中包含的字符 , 该缓存不必以 0 结尾
DWORD CharLowerBuff(PTSTR pszString,DWORD cchString);

DWORD CharUpperBuff(PTSTR pszString,DWORD cchString);

C 与 Unicode 函数

isalpha IsCharAlpha(TCHAR ch); //如果参数是字母字符，函数返回非零值，否则返回零值。

IsCharAlphaNumber(TCHAR ch); //如果参数是数字，函数返回非零值，否则返回零值。

islower IsCharLower(TCHAR ch); //如果参数是小写字母，函数返回非零值，否则返回零值。

isupper IsCharUpper(TCHAR ch); //如果参数是大写字母，函数返回非零值，否则返回零值。

判断文本是 ANSI 还是 Unicode

//pvBuffer 用于标识要测试的缓存的地址
//cb 用于设定 pvBuffer 指向的字节数
//pResult 是个整数的地址
DWORD IsTextUnicode(CONST PVOID pvBuffer, int cb , PINT pResult);

//用于将宽字符串转换成多字节字符串
int WideCharToMultiByte(
UINT CodePage,
DWORD dwFlags,
LPCWSTR lpWideCharStr,
int cchWideChar,
LPSTR lpMultiByteStr,
int cbMultiByte,
LPCSTR lpDefaultChar,
LPBOOL lpUsedDefaultChar
);

//用于将多字节字符串转换成宽字符串
int MultiByteToWideChar(
UINT CodePage,
DWORD dwFlags,
LPCSTR lpMultiByteStr,
int cbMultiByte,
LPWSTR lpWideCharStr,
int cchWideChar
);

posted on 2012-02-20 10:48 多个马甲阅读(267) 评论(0) 编辑收藏举报

刷新页面返回顶部

多个马甲

Windows Unicode

导航

公告