Windows 编 程中的字符串
(1)在win32编程中,如何使用string类型
#include <string> using namespace std;
LPTSTR lpCmdLine = L"hello world";
string cmd = lpCmdLine;
(2)字符格式基础:
传统的ansi字符在C语言中用char数据类型表示(1字节)。在源代码中声明一个字符串,则编译器会转换为由8位char数据类型构成的一个数组(以"/0"结尾)
char c='a';//一个8位的字符
char szbuffer[100]="a string";//含有99个8位字符和1个8位结束符(/0)的数组
微软的c/c++编译器为unicode定义了一个内建的数据结构,wchar_t,它表示一个16位的unicode(UTF-16)字符。
wchar_t c=L'a';//一个16位的字符
wchar_t szbuffer[100]=L"a string";//含有99个16位字符和1个16位结束符(/0)的数组
字符串比较函数:
if (_stricmp("hello world", cmd.c_str()) == 0){ }
lstrcmp 对两个字符串进行区分大小写的比较
lstrcmpi 对两个字符串进行不区分大小写的比较
(3)C运行库中的安全字符串处理函数
通常,修改字符串的函数都存在一个安全隐患,即目标字符串的缓冲不够大,则会导致内存中的数据被破坏。
例如:
WCHAR szbuffer[3]=L"";
wcscpy(szbuffer,L"abc");
以上的例子是以0结尾的,需要szbuffer[4]才可以容纳。但编译时并不会有任何报错或警告。
针对以上问题,我们必须使用“安全字符串处理函数”,这一类的函数以_s结尾(secure之意),我们来看一下这类函数的原型.
PTSTR _tcscpy(PTSTR strDestination,PCTSTR strSource);
errno_t _tcscpy_s(PTSTR strDestination,size_t numberOfCharacters,PCTSTR strSource);
PTSTR _tcscat(PTSTR strDestination,PCTSTR strSource);
errno_t _tcscat_s(PTSTR strDestination,size_t numberOfCharacters,PCTSTR strSource);
可以看到,在将一个缓冲区作为目标缓冲区时,必须提供这个缓冲区的大小(可容纳的字符个数),通过调用_countof宏计算出来。
这个缓冲区大小参数的主要任务就是验证缓冲区是否足以容纳结果数据.
现在,我们调用这些安全函数的时候,就可以检查返回的errno_t值。只有返回S_OK值,才表明函数调用成功。其他的值可以参照errno.h中的定义。
来看一个例子:
TCHAR szbuffer[3]=L"";
_tcscpy_s(szbuffer,_countof(szbuffer),_T("abc"));
执行完后, szbuffer的第一个字符被设置为'/0',而其他所有字节全部被设置为0xfd(填充符)。
(4)c运行库增加的函数:控制如何截断字符串
这类函数具有两个版本,对应ansi和unicode。
HRESULT StringCchCat( LPTSTR pszDest,size_t cchDest,LPCTSTR pszSrc); HRESULT StringCchCatEx( LPTSTR pszDest,size_t cchDest, LPCTSTR pszSrc,LPTSTR *ppszDestEnd,size_t *pcchRemaining,DWORD dwFlags); HRESULT StringCchCopy( LPTSTR pszDest,size_t cchDest, LPCTSTR pszSrc); HRESULT StringCchCopyEx(LPTSTR pszDest,size_t cchDest, LPCTSTR pszSrc, LPTSTR *ppszDestEnd,size_t *pcchRemaining,DWORD dwFlags);
可以看出,在所有方法的名称中,都含有一个“Cch”,这表示count of characters,即字符个数。通常使用_countof宏获得。
另外还有一些函数含有“cb”,这表示函数要求用字节数来指定大小。通常使用sizeof()获得。
这些函数返回HRESULT,具体的值
S_OK | 成功。目标缓冲区中包含源字符串,并以/0终止 |
STRSAFE_E_INVALID_PARAMETER | 失败。将NULL传给了一个参数 |
STRSAFE_E_INSUFFICIENT_BUFFER | 失败。指定的目标缓冲区太小,无法容纳整个源字符串 |
不同于安全字符串处理函数,这类函数运行时,当缓冲区太小,则会执行截断。
(5)windows字符串处理函数
在shlwapi.h定义了大量好用的字符串函数,可以用来对操作系统有关的数值进行格式化操作。
例如,比较两个字符串是否相等:对于这样的需求可以使用CompareString(Ex)或者CompareStringOrdinal。
CompareString(Ex)一般用于向用户显示的字符串。
CompareStringOrdinal一般用于比较程序内部的字符串,如路径名,注册表项值等。
CompareString(Ex)的处理速度相对于CompareStringOrdinal较慢。
这两个函数的返回0,则表示调用失败;
返回1(CSTR_LESS_THAN)表明string1小于string2;
返回2(CSTR_GREATER_THAN)表明string1大于string2.
(6)推荐的字符处理方式
1、使用通用数据类型和宏,如TCHAR和_T
2、将字符串想象成字符的数组,而非char或字节的数组。
3、与字符串有关的计算需修改。尤其要搞清楚很多的函数要求传递的是字符数还是字节数,如是前者,则用_countof()获取;如是后者,则用(字符数*sizeof(字符类型))获取。
4、避免使用printf系列函数转换ansi和unicode。正确的做法是使用MultiByteToWideChar或WideCharToMultiByte。
5、始终使用安全的字符串处理函数,_s或stringcch,如要控制截断,则使用后者。
6、如果一个缓冲区处理函数的参数中不包括目标缓冲区的长度,那么避免使用。
7、比较字符串时,使用CompareStringOrdina和CompareString(Ex)。前者速度快,适合处理程序内部的字符串;后者用于处理UI的字符串,因为它是以区域设置来适当排序,速度较慢。
转自http://blog.csdn.net/shentao17792/article/details/5314312