c++ L _T()

 

字符串前面加L表示该字符串是Unicode字符串。
_T是一个宏,如果项目使用了Unicode字符集(定义了UNICODE宏),则自动在字符串前面加上L,否则字符串不变。因此, Visual C++里边定义字符串的时候,用_T来保证兼容性。 VC支持ascii和unicode两种字符类型,用_T可以保证从ascii编码类型转换到unicode编码类型的时候,程序不需要修改。

以下是别人的总结:
一、在字符串前加一个L作用:  
  如 L"我的字符串" 表示将ANSI字符串转换成unicode的字符串,就是每个字符占用两个字节。  
  strlen("asd") = 3;   
  strlen(L"asd") = 6;  
  二、 _T宏可以把一个引号引起来的字符串,根据你的环境设置,使得编译器会根据编译目标环境选择合适的(Unicode还是ANSI)字符处理方式  
  如果你定义了UNICODE,那么_T宏会把字符串前面加一个L。这时 _T("ABCD") 相当于 L"ABCD" ,这是宽字符串。 
  如果没有定义,那么_T宏不会在字符串前面加那个L,_T("ABCD") 就等价于 "ABCD"  
三、TEXT,_TEXT 和_T 一样的  
如下面三语句:   
  TCHAR szStr1[] = TEXT("str1");   
  char szStr2[] = "str2";   
  WCHAR szStr3[] = L("str3");   
  那么第一句话在定义了UNICODE时会解释为第三句话,没有定义时就等于第二句话。   
  但二句话无论是否定义了UNICODE都是生成一个ANSI字符串,而第三句话总是生成UNICODE字符串。 
  为了程序的可移植性,建议都用第一种表示方法。但在某些情况下,某个字符必须为ANSI或UNICODE,那就用后两种方法。
别人的总结2:
你要确定你需要的字符串是宽字符还是窄字符。_T("")是说如果你定义了UNICODE 那么就是L"",没有定义就是"";以下情况用_T()比较好,其他情况最好别用:
1,用THCAR,LPTSTR,LPCTSTR等tchar数据类型的时候
2,用_tprintf之类的_t版本运行时函数时候
3,像下面这样有w和a版本的api,调用CreateFile的时候
#ifdef UNICODE
#define CreateFile CreateFileW
#else
#define CreateFile CreateFileA
#endif // !UNICODE
来自:https://blog.csdn.net/Awey_001/article/details/6130795

================

 

  _T("")是一个宏,他的作用是让你的程序支持Unicode编码,因为Windows使用两种字符集ANSI和UNICODE,
前者就是通常使用的单字节方式,但这种方式处理象中文这样的双字节字符不方便,容易出现半个汉字的情况。
而后者是双字节方式,方便处理双字节字符。

       Windows NT的所有与字符有关的函数都提供两种方式的版本,而Windows 9x只支持ANSI方式。如果你编译一个程序为ANSI方式,_T实际不起任何作用。而如果编译一个程序为UNICODE方式,则编译器会把"Hello"字符串以UNICODE方式保存。_T和_L的区别在于,_L不管你是以什么方式编译,一律以UNICODE方式保存。

 

LPSTR:32bit指针指向一个字符串,每个字符占1字节

LPCSTR:32-bit指针指向一个常字符串,每个字符占1字节
LPCTSTR:32-bit指针指向一个常字符串,每字符可能占1字节或2字节,取决于Unicode是否定义
LPTSTR:32-bit指针每字符可能占1字节或2字节,取决于Unicode是否定义

 

        L是表示字符串资源为Unicode的。

比如
wchar_t Str[] = L"Hello World!";
这个就是双子节存储字符了。

        _T是一个适配的宏~


#ifdef _UNICODE的时候
_T就是L
没有#ifdef _UNICODE的时候
_T就是ANSI的。

比如

LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");
以上两句使得无论是在UNICODE编译条件下都是正确编译的。

而且MS推荐你使用相匹配的字符串函数。
比如处理LPTSTR或者LPCTSTR 的时候,不要用strlen ,而是要用_tcslen

否则在UNICODE的编译条件下,strlen不能处理 wchar_t*的字符串。

T是非常有意思的一个符号(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一种中间类型,既不明确表示使用 MBCS,也不明确表示使用 UNICODE。那到底使用哪种字符集?编译的时候才决定

来自:https://www.cnblogs.com/wecfly/p/15469017.html
 
 
 
c++ string 中的 编码格式:

在 C++ 中,标准库提供的 std::string 并不直接规定其内部字符编码格式。它只是一个字符容器,通常用于存储以 char 类型表示的字符串。因此,std::string 内部的字符编码取决于你所使用的字符集和编译器的设置。最常见的字符编码是 ASCII 和 UTF-8。

以下是一些关于 C++ 中字符串编码的详细信息:

  1. ASCII:在许多传统和简单的应用中,std::string 内部存储的字符是 ASCII 编码的。ASCII 是一种7位编码方案,每个字符占用一个字节。

  2. UTF-8:这是现代应用程序中最常见的编码方式。UTF-8 是一种变长字符编码,每个字符可以占用 1 到 4 个字节。UTF-8 向后兼容 ASCII,即 ASCII 字符在 UTF-8 中仍然占用一个字节。很多 C++ 程序在处理多语言文本时会使用 UTF-8 编码。

  3. 其他编码:虽然较少见,std::string 也可以存储其他编码的字符数据,如 ISO-8859 系列编码。

std::wstringstd::u16string 等其他字符串类型:

  • std::wstring:用于存储宽字符(wchar_t),其大小取决于编译器和平台。在 Windows 上通常是 2 字节,表示 UTF-16 编码。在 Unix 系统(如 Linux 和 macOS)上通常是 4 字节,表示 UTF-32 编码。

  • std::u16string 和 std::u32string:C++11 引入了这两种字符串类型,分别用于存储 UTF-16 和 UTF-32 编码的字符串数据。它们使用 char16_tchar32_t 类型来表示字符。

 

#include <iostream>
#include <string>

int main() {
std::string ascii_str = "Hello, World!";
std::wstring wide_str = L"Hello, World!";
std::u16string u16_str = u"Hello, World!";
std::u32string u32_str = U"Hello, World!";

std::cout << "std::string (ASCII/UTF-8): " << ascii_str << std::endl;
std::wcout << L"std::wstring (UTF-16/UTF-32): " << wide_str << std::endl;
// For u16string and u32string, use a loop to print each character as there's no direct support in std::cout
std::cout << "std::u16string (UTF-16): ";
for (char16_t c : u16_str) {
std::cout << char(c);
}
std::cout << std::endl;

std::cout << "std::u32string (UTF-32): ";
for (char32_t c : u32_str) {
std::cout << char(c);
}
std::cout << std::endl;

return 0;
}

 

 

 

 

 

参考:

 

posted @ 2024-05-22 11:34  redrobot  阅读(9)  评论(0编辑  收藏  举报