CString、LPCTSTR、LPTSTR、TCHAR、WCHAR、string、wchar_t、char解析

一.类型简介

1.CString:动态的TCHAR数组。它是一个完全独立的类,封装了“+”等操作符和字符串操作方法,换句话说就是CString是对TCHAR操作的方法的集合。

2.LPCTSTR:常量的TCHAR指针,其定义为

      typedef const TCHAR* LPCTSTR

其中

     L表示long指针 这是为了兼容Windows 3.1等16位操作系统遗留下来的,在win32中以及其他的32位操作系统中, long指针和near指针及far修饰符都

       是为了兼容的作用。没有实际意义。

P表示这是一个指针

C表示是一个常量

T表示在Win32环境中, 有一个_T宏

STR表示这个变量是一个字符串

2.LPTSTR:TCHAR指针,其定义为

      typedef TCHAR* LPTSTR

L、P、T的含义同上。

3.TCHAR:TCHAR其实是一个宏,其定义为:

      #ifdef UNICODE
      typedef wchar_t TCHAR;
      #else
      typedef char TCHAR;
      #endif

也就是说,如果我们使用unicode编码,那么TCHAR指的就是wchat_t,如果我们使用的是ASCII编码,那么TCHAR指的就是char,这样处理的目的是为了程序的可移植性。T表示在Win32环境中, 有一个_T宏 。

4.WCHAR:WCHAR其实也是一个宏,表示的就是wchar_t,为了书写方便重新定义的一个宏而已,其定义为:

      typedef wchar_t WCHAR

5.string:string是c++中的字符串变量,因为操作c类型的char非常麻烦,而且很容易出现内存泄漏,所以c++就对c中的char 进行了封装,其中

包含了赋值、删除、增加等常用操作,这些操作都不用考虑内存,是的使用更加方便,所以能使用string就尽量使用string,使用string要包含其头文件:
 #include <string>
注意不是:
      #include <string.h>

因为string.h是C字符串头文件。

string中常用的函数有:

a) =,assign()   //赋以新值
b) swap()   //交换两个字符串的内容
c) +=,append(),push_back() //在尾部添加字符
d) insert() //插入字符
e) erase() //删除字符
f) clear() //删除全部字符
g) replace() //替换字符
h) + //串联字符串
i) ==,!=,<,<=,>,>=,compare()  //比较字符串
j) size(),length()  //返回字符数量
k) max_size() //返回字符的可能最大个数
l) empty()  //判断字符串是否为空
m) capacity() //返回重新分配之前的字符容量
n) reserve() //保留一定量内存以容纳一定数量的字符
o) [ ], at() //存取单一字符
p) >>,getline() //从stream读取某值
q) <<  //将谋值写入stream
r) copy() //将某值赋值为一个C_string
s) c_str() //将内容以C_string返回
t) data() //将内容以字符数组形式返回
u) substr() //返回某个子字符串
v)查找函数
w)begin() end() //提供类似STL的迭代器支持
x) rbegin() rend() //逆向迭代器
y) get_allocator() //返回配置器
 
6.wchar_t:wchar_t是c++中用来表示宽字节的数据类型,即unicode编码的数据类型。
7.char:char是c中的字符数据类型,属于ASCII编码。
下面是msdn上给出的定义:
type                Meaning in MBCS builds          Meaning in Unicode builds

WCHAR                 wchar_t                             wchar_t
LPSTR                 char*                               char*
LPCSTR                const char*                         const char*
LPWSTR                wchar_t*                            wchar_t*
LPCWSTR               const wchar_t*                      const wchar_t* 
TCHAR                 char                                wchar_t
LPTSTR                TCHAR*                              TCHAR*
LPCTSTR               const TCHAR*                        const TCHAR*

二.相互转化

既然有定义了这么多的数据类型,所以他们之间的相互转化是少不了的。
A):CString的转化
1.CString和LPCTSTR的转化:
  CString和LPCTSTR不需要转化,两者是等价的,所以:
CString str("cstring");
LPCTSTR pcStr = str;

2.CString和LPTSTR的转化:

下述转法虽然可以,但是却不安全:

CString str("string");
LPTSTR pStr = (LPTSTR)(LPCTSTR)(str);

因为本来转化后的字符串变得可以修改了,造成了安全隐患。

正确的转化方法为:

CString str("string");
LPTSTR pStr = str.GetBuffer();
str.ReleaseBuffer();
注意:GetBuffer()和ReleaseBuffer()之间不可以调用任何的CString函数,比如GetLength()函数,因为无法预测对内存的操作,所以任何CString函数得到的
结果都是不确定的。
 

3.CString和WCHAR*(wchar_t*)的转化

方法一:使用wcscpy()函数

CString str("string");
WCHAR pWchar[100];
wcscpy(pWchar,str);

方法二:使用wcscpy_s()函数

这个函数是上一个函数的安全版本,调用上一个函数如果pWchar的内存不足时,容易引发意味的错误,但是wcscpy_s()则不会,应该其内存大小已经指定出来了:

CString str("string");
WCHAR pWchar[100];
wcscpy(pWchar,100,str);

方法三:使用_tcscpy()函数

CString str("string");
WCHAR pStr[100];
_tcscpy(pStr,str);

方法四:使用_tcscpy_s()函数

同wcscpy_s()一样,_tcscpy_s()函数也是_tcscpy()函数的安全版本:

CString str("string");
WCHAR pStr[100];
_tcscpy_s(pStr,100,str);
 

4.CString和char*的转化

方法一:使用wcstombs()函数

CString str("string");
char pChar[100];
wcstombs(pChar,str,100);

方法二:使用wcstombs_s()函数

同上面一样,wcstombs_s()是wcstombs()的安全版本:

总结:

      上面一会使用strcpy(),一会使用wcscpy(),一会又使用_tcscpy(),这三者有什么关系呢,其实strcpy()处理的就是ASCII编码的字符,像char,而wcscpy()处理的是Unicode 编码,_tcscpy()则是一个宏,如果你使用的是ASCII编码,那么_tcscpy()表示的就是strcpy(),如果你使用的是Unicode编码,那么_tcscpy()表示的就是wcscpy(),这可以通过定义_UNICODE或UNICODE宏来实现。你可能已经知道了为什么要定义这么一个宏,对!就是为了代码的移植。还有一个函数就是wcstombs(),这个函数是干什么用的呢?其实除了Unicode编码,还有一个编码,那就是多字节编码,通常用的是双字节编码,vc就支持这种编码,函数wcstombs()就是为了实现多字节和单字节转换而设计的。

posted @ 2011-05-12 19:31  MagiCube  阅读(7525)  评论(0编辑  收藏  举报