CString::GetLength()获得字节数的正确方法

前段时间,做http协议上传文件及断点续传控件时,在客户端采用C++调用CHttpConnection、CHttpFile进行文件上传。移植到Unicode编码时,上传得到的文件总是小于正常文件。最终发现问题出在CString::GetLength()方法上。当采用Unicode编码时,而且http header字符串中出现了中文或其其他多字节字符,该方法仍旧只返回字符数,而不是实际的字节数,这样在http header中的信息会比实际的少,导致http发送的数据小于预期的。

      按照MSDN的说吗,在选用MBCS多字节字符串编码时,该方法会得到正确的字节数。此时没有问题。

      For multibyte character sets (MBCS), GetLength counts each 8-bit character; that is, a lead and trail byte in one multibyte character are counted as two bytes.

      但是在Unicode编码下,一旦出现中文字符,该方法就会少统计。

      我试用最多的解决方法是:

      CString str("abc我");

      DWORD le0 = str.GetLength(); // 返回4,不是想要的字节数

      // 这样处理就对了。先用CStringA类转化成多字节字符串。

      le0 = CStringA(str).GetLength();

 

另外,也有人这样用,也可以。比上面效率高。

       DWORD le0 = str.GetLength() * sizeof(TCHAR);

// 这种用法在MBCS环境下可以省略。在Unicode下,所有字符(包括ascii及中文字符), 每个字符都被定义为WHAR, 即双字节Unicode字符。该方法也正确。

posted @ 2012-11-09 17:06  郑文亮  阅读(29193)  评论(0编辑  收藏  举报