CString、LPCTSTR、LPTSTR、TCHAR、WCHAR、string、wchar_t、char解析
一.类型简介
1.CString:动态的TCHAR数组。它是一个完全独立的类,封装了“+”等操作符和字符串操作方法,换句话说就是CString是对TCHAR操作的方法的集合。
2.LPCTSTR:常量的TCHAR指针,其定义为
typedef const TCHAR* LPCTSTR
其中
L表示long指针 这是为了兼容Windows 3.1等16位操作系统遗留下来的,在win32中以及其他的32位操作系统中, long指针和near指针及far修饰符都
是为了兼容的作用。没有实际意义。
P表示这是一个指针
C表示是一个常量
T表示在Win32环境中, 有一个_T宏
STR表示这个变量是一个字符串
。
2.LPTSTR:TCHAR指针,其定义为
typedef TCHAR* LPTSTR
L、P、T的含义同上。
3.TCHAR:TCHAR其实是一个宏,其定义为:
#ifdef UNICODE typedef wchar_t TCHAR; #else typedef char TCHAR; #endif
也就是说,如果我们使用unicode编码,那么TCHAR指的就是wchat_t,如果我们使用的是ASCII编码,那么TCHAR指的就是char,这样处理的目的是为了程序的可移植性。T表示在Win32环境中, 有一个_T宏 。
4.WCHAR:WCHAR其实也是一个宏,表示的就是wchar_t,为了书写方便重新定义的一个宏而已,其定义为:
typedef wchar_t WCHAR
5.string:string是c++中的字符串变量,因为操作c类型的char非常麻烦,而且很容易出现内存泄漏,所以c++就对c中的char 进行了封装,其中
包含了赋值、删除、增加等常用操作,这些操作都不用考虑内存,是的使用更加方便,所以能使用string就尽量使用string,使用string要包含其头文件:
#include <string>
注意不是:
#include <string.h>
因为string.h是C字符串头文件。
string中常用的函数有:
a) =,assign() //赋以新值 b) swap() //交换两个字符串的内容 c) +=,append(),push_back() //在尾部添加字符 d) insert() //插入字符 e) erase() //删除字符 f) clear() //删除全部字符 g) replace() //替换字符 h) + //串联字符串 i) ==,!=,<,<=,>,>=,compare() //比较字符串 j) size(),length() //返回字符数量 k) max_size() //返回字符的可能最大个数 l) empty() //判断字符串是否为空 m) capacity() //返回重新分配之前的字符容量 n) reserve() //保留一定量内存以容纳一定数量的字符 o) [ ], at() //存取单一字符 p) >>,getline() //从stream读取某值 q) << //将谋值写入stream r) copy() //将某值赋值为一个C_string s) c_str() //将内容以C_string返回 t) data() //将内容以字符数组形式返回 u) substr() //返回某个子字符串 v)查找函数 w)begin() end() //提供类似STL的迭代器支持 x) rbegin() rend() //逆向迭代器 y) get_allocator() //返回配置器
6.wchar_t:wchar_t是c++中用来表示宽字节的数据类型,即unicode编码的数据类型。
7.char:char是c中的字符数据类型,属于ASCII编码。
下面是msdn上给出的定义:
type Meaning in MBCS builds Meaning in Unicode builds WCHAR wchar_t wchar_t LPSTR char* char* LPCSTR const char* const char* LPWSTR wchar_t* wchar_t* LPCWSTR const wchar_t* const wchar_t* TCHAR char wchar_t LPTSTR TCHAR* TCHAR* LPCTSTR const TCHAR* const TCHAR*
二.相互转化
既然有定义了这么多的数据类型,所以他们之间的相互转化是少不了的。
A):CString的转化
1.CString和LPCTSTR的转化:
CString和LPCTSTR不需要转化,两者是等价的,所以:
CString str("cstring"); LPCTSTR pcStr = str;
2.CString和LPTSTR的转化:
下述转法虽然可以,但是却不安全:
CString str("string"); LPTSTR pStr = (LPTSTR)(LPCTSTR)(str);
因为本来转化后的字符串变得可以修改了,造成了安全隐患。
正确的转化方法为:
CString str("string"); LPTSTR pStr = str.GetBuffer(); str.ReleaseBuffer();
注意:GetBuffer()和ReleaseBuffer()之间不可以调用任何的CString函数,比如GetLength()函数,因为无法预测对内存的操作,所以任何CString函数得到的
结果都是不确定的。
3.CString和WCHAR*(wchar_t*)的转化
方法一:使用wcscpy()函数
CString str("string"); WCHAR pWchar[100]; wcscpy(pWchar,str);
方法二:使用wcscpy_s()函数
这个函数是上一个函数的安全版本,调用上一个函数如果pWchar的内存不足时,容易引发意味的错误,但是wcscpy_s()则不会,应该其内存大小已经指定出来了:
CString str("string"); WCHAR pWchar[100]; wcscpy(pWchar,100,str);
方法三:使用_tcscpy()函数
CString str("string"); WCHAR pStr[100]; _tcscpy(pStr,str);
方法四:使用_tcscpy_s()函数
同wcscpy_s()一样,_tcscpy_s()函数也是_tcscpy()函数的安全版本:
CString str("string"); WCHAR pStr[100]; _tcscpy_s(pStr,100,str);
4.CString和char*的转化
方法一:使用wcstombs()函数
CString str("string"); char pChar[100]; wcstombs(pChar,str,100);
方法二:使用wcstombs_s()函数
同上面一样,wcstombs_s()是wcstombs()的安全版本:
总结:
上面一会使用strcpy(),一会使用wcscpy(),一会又使用_tcscpy(),这三者有什么关系呢,其实strcpy()处理的就是ASCII编码的字符,像char,而wcscpy()处理的是Unicode 编码,_tcscpy()则是一个宏,如果你使用的是ASCII编码,那么_tcscpy()表示的就是strcpy(),如果你使用的是Unicode编码,那么_tcscpy()表示的就是wcscpy(),这可以通过定义_UNICODE或UNICODE宏来实现。你可能已经知道了为什么要定义这么一个宏,对!就是为了代码的移植。还有一个函数就是wcstombs(),这个函数是干什么用的呢?其实除了Unicode编码,还有一个编码,那就是多字节编码,通常用的是双字节编码,vc就支持这种编码,函数wcstombs()就是为了实现多字节和单字节转换而设计的。