老哈的学习记录

知其然,更要知其所以然

  :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

最近把一个之前在VC6.0下做的工程放到VS2008下修改,结果发现编译出错,查找相关资料后,发现主要是VS2008下默认的是 使用UNICODE字符集,而在VC6.0下默认的是使用多字节字符集,结果导致CString,TCHAR等都出现一些问题,于是又顺便恶补了一下字符集相关的知识。

 

关于几种字符类型:

CHAR:一个字符占8位,1个字节,可以表示中文,但是会有本地化问题,就比如有时候下到一个游戏,结果发现所有文字都是乱码,需要设置本机的区域选项才可以正常显示文字,就是因为这个问题导致的,如果使用WCHAR就不会有这个问题。

WCHAR:一个字符占16位,2个字节,可以表示中文,不会有本地化问题。使用这个可以不用担心目录是否是中文之类的。

TCHAR:这个根据开发环境的字符集选项不同而不同,在使用UNICODE字符集的时候,这个是WHCAR,而使用多字节字符集的时候,这个是CHAR。

 

不同字符间的转换:

 

    char sAnsi[20];
    memset(sAnsi, 0x00, 20);
    sprintf(sAnsi, "ANSI字符串");

    //////////////////////////////////////////////////////////////////////////
    //char TO wchar
    wchar_t *pwsUnicode = NULL;
    int nWChLen = MultiByteToWideChar(CP_ACP, 0, sAnsi, -1, NULL, 0);    //获取转换后的wchar长度 8 7个字符+1个结束符
    pwsUnicode = new wchar_t[nWChLen];
    MultiByteToWideChar(CP_ACP, 0, sAnsi, -1, pwsUnicode, nWChLen);    //实际转换
    //使用完后删除
//     delete[] pwsUnicode;
//     pwsUnicode = NULL;

    //////////////////////////////////////////////////////////////////////////
    //wchar TO char
    char *psAnsi = NULL;
    int nChLen = WideCharToMultiByte(CP_ACP, 0, pwsUnicode, -1, NULL, 0, NULL, NULL);  //获取转换后的长度 11 4个英文字符+3个中文字符*2+1个结束符
    psAnsi = new char[nChLen];
    WideCharToMultiByte(CP_ACP, 0, pwsUnicode, -1, psAnsi, nChLen, NULL, NULL);
    //使用后删除
//     delete[] psAnsi;
//     psAnsi = NULL;

    delete[] pwsUnicode;
    pwsUnicode = NULL;
    delete[] psAnsi;
    psAnsi = NULL;

 


关于第一个参数CP_ACP

 

这个参数主要指的是CHAR的内容所在的字符集和WCHAR没有关系

 

另外,这两个函数需要的头文件是 windows.h。

 

几个字符的宏:

_T("TCHAR")//根据字符集设置改变

L"WCHAR"//UNICODE字符

 

 

P.S:linux下:

这个函数在linux下有类似的函数iconvmbstowcswcstombs需要配合setlocale函数使用。如果转换函数转换失败,那么需要考虑你的linux系统是否有安装相应的字符集。如果你在setlocale时候就出错返回NULL了,那基本就是系统没有相应的字符集了,装字符集去吧。

posted on 2012-09-12 21:18  Aries Lu  阅读(615)  评论(0编辑  收藏  举报