TCHAR、WCHAR、CHAR以及WideCharToMultiByte、MultiByteToWideChar

最近把一个之前在VC6.0下做的工程放到VS2008下修改，结果发现编译出错，查找相关资料后，发现主要是VS2008下默认的是使用UNICODE字符集，而在VC6.0下默认的是使用多字节字符集，结果导致CString，TCHAR等都出现一些问题，于是又顺便恶补了一下字符集相关的知识。

关于几种字符类型：

CHAR：一个字符占8位，1个字节，可以表示中文，但是会有本地化问题，就比如有时候下到一个游戏，结果发现所有文字都是乱码，需要设置本机的区域选项才可以正常显示文字，就是因为这个问题导致的，如果使用WCHAR就不会有这个问题。

WCHAR：一个字符占16位，2个字节，可以表示中文，不会有本地化问题。使用这个可以不用担心目录是否是中文之类的。

TCHAR：这个根据开发环境的字符集选项不同而不同，在使用UNICODE字符集的时候，这个是WHCAR，而使用多字节字符集的时候，这个是CHAR。

不同字符间的转换：

    char sAnsi[20];
    memset(sAnsi, 0x00, 20);
    sprintf(sAnsi, "ANSI字符串");

    //////////////////////////////////////////////////////////////////////////
    //char TO wchar
    wchar_t *pwsUnicode = NULL;
    int nWChLen = MultiByteToWideChar(CP_ACP, 0, sAnsi, -1, NULL, 0);    //获取转换后的wchar长度 8 7个字符+1个结束符
    pwsUnicode = new wchar_t[nWChLen];
    MultiByteToWideChar(CP_ACP, 0, sAnsi, -1, pwsUnicode, nWChLen);    //实际转换
    //使用完后删除
//     delete[] pwsUnicode;
//     pwsUnicode = NULL;

    //////////////////////////////////////////////////////////////////////////
    //wchar TO char
    char *psAnsi = NULL;
    int nChLen = WideCharToMultiByte(CP_ACP, 0, pwsUnicode, -1, NULL, 0, NULL, NULL);　　//获取转换后的长度 11 4个英文字符+3个中文字符*2+1个结束符
    psAnsi = new char[nChLen];
    WideCharToMultiByte(CP_ACP, 0, pwsUnicode, -1, psAnsi, nChLen, NULL, NULL);
    //使用后删除
//     delete[] psAnsi;
//     psAnsi = NULL;

    delete[] pwsUnicode;
    pwsUnicode = NULL;
    delete[] psAnsi;
    psAnsi = NULL;

关于第一个参数CP_ACP：

这个参数主要指的是CHAR的内容所在的字符集和WCHAR没有关系。

另外，这两个函数需要的头文件是 windows.h。

几个字符的宏：

_T("TCHAR")//根据字符集设置改变

L"WCHAR"//UNICODE字符

P.S：linux下：

这个函数在linux下有类似的函数iconv和mbstowcs、wcstombs，需要配合setlocale函数使用。如果转换函数转换失败，那么需要考虑你的linux系统是否有安装相应的字符集。如果你在setlocale时候就出错返回NULL了，那基本就是系统没有相应的字符集了，装字符集去吧。

posted on 2012-09-12 21:18 Aries Lu 阅读(615) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

老哈的学习记录

公告

关于几种字符类型：

不同字符间的转换：

P.S：linux下：