LPCTSTR,CString与const char*,WCHAR转换为CHAR杂谈

1.LPCTSTR

L表示Long

P表示指针

C表示是一个常量

T表示Win32环境中有一个_T宏

STR表示一个字符串

所以LPCTSTR就是一个指向const对象的指针

2.常量字符串ansi和unicode的区分是由宏_T来决定的。但是用_T("abcd")时, 字符串"abcd"就会根据编译时是否定是_UNICODE来决定是char* 还是 wchar_t*。

ansi情况下,LPCTSTR 就是 const char*, 是常量字符串(不能修改的)。
而LPTSTR 就是 char*, 即普通字符串(非常量,可修改的)。
这两种都是基本类型, 而CString 是 C++类, 兼容这两种基本类型是最起码的任务了。
由于const char* 最简单(常量,不涉及内存变更,操作迅速), CString 直接定义了一个类型转换函数:
operator LPCTSTR( )
{.
.....
}

函数直接返回所维护的字符串。

     当你需要一个const char* 而传入了CString时, C++编译器自动调用 CString重载的操作符 LPCTSTR()来进行隐式的类型转换。
     当需要CString , 而传入了 const char* 时(其实 char* 也可以),C++编译器则自动调用CString的构造函数来构造临时的 CString对象。
     因此CString 和 LPCTSTR 基本可以通用。

3.LPCTSTR 它的执行过程其实很简单,只是返回引用内存块的串地址。 它是作为操作符重载提供的, 

所以在代码中有时可以隐式转换,而有时却需强制转制。如: 
CString str; 
const char* p = (LPCTSTR)str; 
//假设有这样的一个函数,Test(const char* p); 你就可以这样调用 
Test(str);//这里会隐式转换为LPCTSTR   LPTSTR和LPCTSTR的区别就是不在是const类型,相当于char*

再者,string类型转换成const char* 类型的方法:string::c_str().

1. string转const char*
   string s = "abc";
   const char* c_s = s.c_str();
2. const char*转string
   直接赋值即可
   const char* c_s = "abc";
   string s(c_s);
3. string转char*
   string s = "abc";
   char* c;
   const int len = s.length();
   c = new char[len+1];
   strcpy(c,s.c_str());
4. char*转string
   char* c = "abc";
   string s(c);
5. const char*转char*
   const char* cpc = "abc";
   char* pc = new char[100];//足够长
   strcpy(pc,cpc);
6. char*转const char*
   直接赋值即可
   char* pc = "abc";
   const char* cpc = pc;

4.GetBuffer(int nMinBufLength)与 它类似,也会返回一个指针,不过它有点差别,返回的是LPTSTR 

5.这两者到底有何不同呢?其本质上完全不一样,一般说LPCTSTR转换后只应该当常量使用,或者做函数的入参;而GetBuffer(...)取出指针后,可以通过这个指针来修改里面的内容,或者做函数的入参。为什么呢?也许经常有这样的代码: 
CString str("abcd"); 
char* p = (char*)(const char*)str; 
p[2] = 'z'; 
其实,也许有这样的代码后,你的程序并没有错,而且程序也运行得挺好。但它却是非常危险的。再看 
CString str("abcd"); 
CString test = str; 
.... 
char* p = (char*)(const char*)str; 
p[2] = 'z'; 
strcpy(p, "akfjaksjfakfakfakj");//这下完蛋了 
你知道此时,test中的值是多少吗?答案是"abzd".它也跟着改变了,这不是你所期望发生的。但为什么会这样呢?你稍微想想就会明白,前面说过,因为CString是指向引用块的,str与test指向同一块地方,当你p[2]='z'后,当然test也会随着改变。所以用它做LPCTSTR做转换后,你只能去读这块数据,千万别去改变它的内容。 

假如我想直接通过指针去修改数据的话,那怎样办呢?就是用GetBuffer(...).看下述代码: 
CString str("abcd"); 
CString test = str; 
.... 
char* p = str.GetBuffer(20); 
p[2] = 'z'; // 执行到此,现在test中值却仍是"abcd" 
strcpy(p, "akfjaksjfakfakfakj"); // 执行到此,现在test中值还是"abcd" 
为什么会这样?其实GetBuffer(20)调用时,它实际上另外建立了一块新内块存,并分配20字节长度的buffer,而原来的内存块引用计数也相应减1. 所以执行代码后str与test是指向了两块不同的地方,所以相安无事。 

      不过这里还有一点注意事项:就是str.GetBuffer(20)后,str的分配长度为20,即指针p它所指向的buffer只有20字节长,给它赋值时,切不可超过,否则灾难离你不远了;如果指定长度小于原来串长度,如GetBuffer(1),实际上它会分配4个字节长度(即原来串长度);另外,当调用GetBuffer(...)后并改变其内容,一定要记得调用ReleaseBuffer(),这个函数会根据串内容来更新引用内存块的头部信息。 

6.拷贝 & 赋值 & "引用内存块" 什么时候释放? 


下面演示一段代码执行过程 
void Test() 

CString str("abcd");//str指向一引用内存块(引用内存块的引用计数为1, 
长度为4,分配长度为4) 
CString a;//a指向一初始数据状态, 
a = str; //a与str指向同一引用内存块(引用内存块的引用计数为2, 
长度为4,分配长度为4) 
CString b(a);//a、b与str指向同一引用内存块(引用内存块的引用 
计数为3,长度为4,分配长度为4) 

LPCTSTR temp = (LPCTSTR)a;//temp指向引用内存块的串首地址。 
(引用内存块的引用计数为3,长度为4,分配长度为4) 
CString d = a; //a、b、d与str指向同一引用内存块(引用内存块的引用计数为4, 长度为4,分配长度为4) 
b = "testa"; //这条语句实际是调用CString::operator=(CString&)函数。 
b指向一新分配的引用内存块。(新分配的引用内存块的 
引用计数为1,长度为5,分配长度为5) 
//同时原引用内存块引用计数减1. a、d与str仍指向原 
引用内存块(引用内存块的引用计数为3,长度为4,分配长度为4) 
}//由于d生命结束,调用析构函数,导至引用计数减1(引用内存 
块的引用计数为2,长度为4,分配长度为4) 
LPTSTR temp = a.GetBuffer(10);//此语句也会导致重新分配新内存块。 
temp指向新分配引用内存块的串首地址(新 
分配的引用内存块的引用计数为1,长度 
为0,分配长度为10) 
//同时原引用内存块引用计数减1. 只有str仍 
指向原引用内存块(引用内存块的引用计数为1, 
长度为4,分配长度为4) 
strcpy(temp, "temp"); //a指向的引用内存块的引用计数为1,长度为0,分配长度为10 
a.ReleaseBuffer();//注意:a指向的引用内存块的引用计数为1,长度为4,分配长度为10 

//执行到此,所有的局部变量生命周期都已结束。对象str a b 各自调用自己的析构构 
//函数,所指向的引用内存块也相应减1 
//注意,str a b 所分别指向的引用内存块的计数均为0,这导致所分配的内存块释放 
通过观察上面执行过程,我们会发现CString虽然可以多个对象指向同一引用内块存,但是它们在进行各种拷贝、赋值及改变串内容时,它的处理是很智能并且非常安全的,完全做到了互不干涉、互不影响。当然必须要求你的代码使用正确恰当,特别是实际使用中会有更复杂的情况,如做函数参数、引用、及有时需保存到CStringList当中,如果哪怕有一小块地方使用不当,其结果也会导致发生不可预知的错误  

7.C语言中表示字符串,没有string概念,只可以用char*和char[];在MFC中,为了服务于字符串操作,添加了类CString,该类的头 文件是afx.h. 

     从char* 到CString的转换很简单,只需要用CString的构造函数即可。 

    CString类功能强大,比STL的string类有过之无不及.新手使用CString时,都会被它强大的功能所吸引.然而由于对它内部机制的不了解,新手在将CString向C的字符数组转换时容易出现很多问题.因为CString已经重载了LPCTSTR运算符,所以CString类向const char *转换时没有什么麻烦,如下所示:

  char a[100];
  CString str("aaaaaa");
  strncpy(a,(LPCTSTR)str,sizeof(a));

  或者如下:

  strncpy(a,str,sizeof(a));                      注:上面语句将CString-->const char*
  以上两种用法都是正确地.因为strncpy的第二个参数类型为const char *.所以编译器会自动将CString类转换成const char *.很多人对LPCTSTR是什么东西迷惑不解,让我们来看看:

  1.LP表示长指针,在win16下有长指针(LP)和短指针(P)的区别,而在win32下是没有区别的,都是32位.所以这里的LP和P是等价的.

  2.C表示const

  3.T是什么东西呢,我们知道TCHAR在采用UNICODE方式编译时是wchar_t,在普通时编译成char那么就可以看出LPCTSTR(PCTSTR)在UINCODE时是const wchar_t *,PCWSTR,LPCWSTR,在多字节字符模式时是const char *, PCSTR,LPCSTR.接下来我们看在非UNICODE情况下,怎样将CString转换成char *,很多初学者都为了方便采用如下方法:

  (char *)(LPCSTR)str

        注:如果只是将CString-->char*,转换后不修改字符串的内容,这个转换是可以的。
  这样对吗?我们首先来看一个例子:

  CString str("aa");
  strcpy((char *)(LPCTSTR)str,"aaaaaaaa");
  cout<<(LPCTSTR)str<<endl;
  在Debug下运行出现了异常,我们都知道CString类内部有自己的字符指针,指向一个已分配的字符缓冲区.如果往里面写的字符数超出了缓冲区范围,当然会出现异常.但这个程序在Release版本下不会出现问题.原来对CString类已经进行了优化.当需要分配的内存小于64字节时,直接分配64字节的内存,以此类推,一般CString类字符缓冲区的大小为64,128,256,512...这样是为了减少内存分配的次数,提高速度.

  那有人就说我往里面写的字符数不超过它原来的字符数,不就不会出错了,比如

  CString str("aaaaaaa");
  strcpy((char *)(LPCTSTR)str,"aa");
  cout<<(LPCTSTR)str<<endl;
  这样看起来是没什么问题.我们再来看下面这个例子:

  CString str("aaaaaaa");
  strcpy((char *)(LPCTSTR)str,"aa");
  cout<<(LPCTSTR)str<<endl;
  cout<<str.GetLength()<<endl;
  我们看到str的长度没有随之改变,继续为7而不是2.还有更严重的问题:

  CString str("aaaaaaa");
  CString str1 = str;
  strcpy((char *)(LPCTSTR)str,"aa");
  cout<<(LPCTSTR)str<<endl;
  cout<<(LPCTSTR)str1<<endl;
  按说我们只改变了str,str1应该没有改变呀,可是事实时他们都变成了"aa".难道str和str1里面的字符指针指向的缓冲区是一个.我们在Effective C++里面得知,如果你的类内部有包含指针,请为你的类写一个拷贝构造函数和赋值运算符.不要让两个对象内部的指针指向同一区域,而应该重新分配内存.难道是微软犯了错?

  原来这里还有一个"写时复制"和"引用计数"的概念.CString类的用途很广,这样有可能在系统内部产生大量的CString临时对象.这时为了优化效率,就采用在系统软件内部广泛使用的"写时复制"概念.即当从一个CString产生另一个CString并不复制它的字符缓冲区内容,而只是将字符缓冲区的"引用计数"加1.当需要改写字符缓冲区内的内容时,才分配内存,并复制内容.以后我会给出一个"写时复制"和"引用计数"的例子我们回到主题上来,当我们需要将CString转换成char *时,我们应该怎么做呢?其时只是麻烦一点,如下所示:

  CString str("aaaaaaa");
  strcpy(str.GetBuffer(10),"aa");
  str.ReleaseBuffer();

       注:将CString-->char*,并修改字符串内容。
  当我们需要字符数组时调用GetBuffer(int n),其中n为我们需要的字符数组的长度.使用完成后一定要马上调用ReleaseBuffer();还有很重要的一点就是,在能使用const char *的地方,就不要使用char *

8.UNICODE下宽字符的CString转换为const char *和char到WCHAR的相互转换 

UNICODE环境下TCHAR等价于WCHAR,ANSI环境下TCHAR等价于CHAR

//CString转换为char*类型
CString theString( "This is a test" ); int sizeOfString = (theString.GetLength() + 1); LPTSTR lpsz = new TCHAR[ sizeOfString ]; _tcscpy_s(lpsz, sizeOfString, theString); 最后再转换一下lpsz为const型的 LPTSTR在UNICODE环境下编译是wchar_t类型
从WCHAR到char的转换:

int WideCharToMultiByte(

  UINT CodePage,

  DWORD dwFlags,

  LPCWSTR lpWideCharStr,

  int cchWideChar,

  LPSTR lpMultiByteStr,

  int cbMultiByte,

  LPCSTR lpDefaultChar,

  LPBOOL lpUsedDefaultChar

);

 

posted @ 2017-05-04 10:45  swsut_wjy  阅读(2524)  评论(0编辑  收藏  举报