VC中的字符串转换宏

 
        ATL7.0引入了几个新的转换类和宏,现有的宏提供了显着的改善。新的字符串转换类和宏的名称,采取的形式如下:
C SourceType 2[C]DestinationType[EX]

 

        其中,[C]表示目的类型是const类型的,[EX]表示指定了保存字符串数据的固定静态缓存区的大小,如果字符串转换的结果超过了模板参数的大小,使用malloc分配空间,并在对象超出范围时释放内存。所以说这个转换宏(实质是个类)在循环中使用也是安全,它不会堆栈溢出。另外,如果试图分配堆内存和失败,它会调用AtlThrow抛出E_OUTOFMEMORY异常信息。
比较好的使用方法如下:
CA2T szr(szReplaceFile);  

 

不赞成使用如下方法:
LPCTSTR szr = CA2T(szReplaceFile);

 

另外,可以指定缓冲区大小来做为模板参数,如下:
// Changing the size of the buffer. 
void ExampleFunction4(LPCWSTR pszW) 
{ 
   // Use a 16-character buffer. 
   ExampleFunctionA(CW2AEX<16>(pszW)); 
} 

 

指定代码页进行转换,如下:
// Specifying the code page. 
void ExampleFunction5(LPCWSTR pszW) 
{ 
   // Convert to the Macintosh code page 
   ExampleFunctionA(CW2A(pszW, CP_MACCP)); 
} 

 

在实际应用中,Ansi、Unicode、Utf-8之间的转换比较多,方法可如下:
Ansi→Unicode
CA2W pszW(pszA); 

 

Ansi→Utf-8
CW2A pszU8(CA2W(pszA), CP_UTF8);

 

Unicode→Ansi
CW2A pszA(pszW); 

 

Unicode→Utf-8
CW2A pszU8(pszW, CP_UTF8); 

 

Utf-8→Ansi
CW2A pszA(CA2W(pszU8, CP_UTF8)); 

 

Utf-8→Unicode
CA2W pszW(pszU8, CP_UTF8);

 

对于通用字符串_T()来说,如下:
_T→Ansi
CT2A pszA(pszT); 

 

_T→Unicode
CT2W pszW(pszT);
_T→Utf-8
CW2A pszU8(CT2W(pszT), CP_UTF8);

Ansi→_T
CA2T pszT(pszA); 
Unicode→_T
CW2T pszT(pszW);
Utf-8→_T
CW2T pszT(CA2W(pszU8, CP_UTF8));
另外,对于CString,还可以如下:
CStringA strA(pszW); 
CStringW strW(pszA); 
CString str(CA2W(pszU8, CP_UTF8));
测试代码如下:
void CTestFileTestDlg::OnTest() 
{ 
    char *pszAnsi = "akof1314无幻"; 
    ::MessageBoxA(NULL, pszAnsi, NULL, MB_OK); 
    ::MessageBoxW(NULL, CA2W(pszAnsi), NULL, MB_OK); 
 
 
    wchar_t *pszUnicode = L"akof1314无幻"; 
    ::MessageBoxA(NULL, CW2A(pszUnicode), NULL, MB_OK); 
    ::MessageBoxW(NULL, pszUnicode, NULL, MB_OK); 
 
 
    //以下是UTF-8编码的字符串"akof1314无幻" 
    char *pszUtf8 = "\x61\x6b\x6f\x66\x31\x33\x31\x34\xe6\x97\xa0\xe5\xb9\xbb"; 
    ::MessageBoxA(NULL, CW2A(CA2W(pszUtf8, CP_UTF8)), NULL, MB_OK); 
    ::MessageBoxW(NULL, CA2W(pszUtf8, CP_UTF8), NULL, MB_OK); 
 
 
    CStringA strA(pszUnicode); 
    ::MessageBoxA(NULL, strA, NULL, MB_OK); 
 
 
    CStringW strW(pszAnsi); 
    ::MessageBoxW(NULL, strW, NULL, MB_OK); 
 
 
    CString str(CA2W(pszUtf8, CP_UTF8)); 
    ::MessageBox(NULL, str, NULL, MB_OK); 
} 

 

以上输出全部一样,不管在多字节下,还是Unicode环境下。

参考资料:
1.ATL and MFC String Conversion Macros  http://msdn.microsoft.com/en-us/library/87zae4a3(v=vs.110).aspx
2.C++中Ansi、Unicode、UTF8字符串之间的转换和写入文本文件  http://dark0729.blogbus.com/logs/51496111.html
3.UTF-8, CString and CFile? (C++, MFC)  http://stackoverflow.com/questions/2318481/utf-8-cstring-and-cfile-c-mfc

 

posted @ 2015-01-23 11:30  廖先生  阅读(1315)  评论(0编辑  收藏  举报