【原】Windows编程中的字符集编码格式及_T宏的解释

在Windows中，字符集编码有两种：ANSI和Unicode。

ANSI使用单字节，一般用于处理英文，而中文是双字节字符。所以，在处理中文字符时，ANSI编码有时会不方便，出现半个汉字的情况，于是就造成乱码。

Unicode编码使用双字节，即每个字符都占两个字节，这可以很好地兼容汉字。因为不能确定编译完的程序最终会用在什么环境什么字符集上，所有为了提高兼容性，我们一般要在中文字符串前，加宏_T，_TEXT。

比如：_T(”你好，MFC“)

若程序以ANSI格式编译，则_T宏其实没有起任何作用

若程序以Unicode格式编译，则_T会把”你好，MFC“以Unicode格式保存，中英文都被处理。而另一个_L宏则是强制性的以Unicode格式保存（双字节）。_T与_L的区别就在于，一个是适配的，一个是强制的。

wchar_t Str[] = L"Hello World!";
这个就是双子节存储字符了。
_T是一个适配的宏～
当
#ifdef _UNICODE的时候
_T就是L
没有#ifdef _UNICODE的时候
_T就是ANSI的。
比如
LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");

LPSTR：32bit指针指向一个字符串，每个字符占1字节

LPCSTR:32-bit指针指向一个常字符串，每个字符占1字节

LPCTSTR:32-bit指针指向一个常字符串,每字符可能占1字节或2字节，取决于Unicode是否定义

LPTSTR:32-bit指针每字符可能占1字节或2字节，取决于Unicode是否定义

LPTSTR lpStr = new TCHAR[32];

TCHAR* szBuf = _T("Hello");

以上两句使得无论是在UNICODE编译条件下都是正确编译的。

而且MS推荐你使用相匹配的字符串函数。

比如处理LPTSTR或者LPCTSTR 的时候，不要用strlen ,而是要用_tcslen

否则在UNICODE的编译条件下，strlen不能处理 wchar_t*的字符串。

T是非常有意思的一个符号（TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...），它表示使用一种中间类型，既不明确表示使用 MBCS，也不明确表示使用 UNICODE。那到底使用哪种字符集?

编译的时候才决定

posted @ 2013-04-08 10:39 编程小翁阅读(1111) 评论(0) 编辑收藏举报

刷新页面返回顶部

编程小翁

厦门，iOS ing

【原】Windows编程中的字符集编码格式及_T宏的解释

公告