c++ L _T()

字符串前面加L表示该字符串是Unicode字符串。
_T是一个宏，如果项目使用了Unicode字符集（定义了UNICODE宏），则自动在字符串前面加上L，否则字符串不变。因此， Visual C++里边定义字符串的时候，用_T来保证兼容性。 VC支持ascii和unicode两种字符类型，用_T可以保证从ascii编码类型转换到unicode编码类型的时候，程序不需要修改。

以下是别人的总结：

一、在字符串前加一个L作用:
如 L"我的字符串" 表示将ANSI字符串转换成unicode的字符串，就是每个字符占用两个字节。
strlen("asd") = 3;
strlen(L"asd") = 6;
二、 _T宏可以把一个引号引起来的字符串，根据你的环境设置，使得编译器会根据编译目标环境选择合适的（Unicode还是ANSI）字符处理方式
如果你定义了UNICODE，那么_T宏会把字符串前面加一个L。这时 _T("ABCD") 相当于 L"ABCD" ，这是宽字符串。
如果没有定义，那么_T宏不会在字符串前面加那个L，_T("ABCD") 就等价于 "ABCD"
三、TEXT,_TEXT 和_T 一样的
如下面三语句：
TCHAR szStr1[] = TEXT("str1");
char szStr2[] = "str2";
WCHAR szStr3[] = L("str3");
那么第一句话在定义了UNICODE时会解释为第三句话，没有定义时就等于第二句话。
但二句话无论是否定义了UNICODE都是生成一个ANSI字符串，而第三句话总是生成UNICODE字符串。
为了程序的可移植性，建议都用第一种表示方法。但在某些情况下，某个字符必须为ANSI或UNICODE，那就用后两种方法。

别人的总结2：

你要确定你需要的字符串是宽字符还是窄字符。_T("")是说如果你定义了UNICODE 那么就是L"",没有定义就是"";以下情况用_T（）比较好，其他情况最好别用：
1，用THCAR，LPTSTR，LPCTSTR等tchar数据类型的时候
2，用_tprintf之类的_t版本运行时函数时候
3，像下面这样有w和a版本的api，调用CreateFile的时候
#ifdef UNICODE
#define CreateFile CreateFileW
#else
#define CreateFile CreateFileA
#endif // !UNICODE

来自：https://blog.csdn.net/Awey_001/article/details/6130795

================

_T("")是一个宏,他的作用是让你的程序支持Unicode编码，因为Windows使用两种字符集ANSI和UNICODE，
前者就是通常使用的单字节方式，但这种方式处理象中文这样的双字节字符不方便，容易出现半个汉字的情况。
而后者是双字节方式，方便处理双字节字符。

Windows NT的所有与字符有关的函数都提供两种方式的版本，而Windows 9x只支持ANSI方式。如果你编译一个程序为ANSI方式，_T实际不起任何作用。而如果编译一个程序为UNICODE方式，则编译器会把"Hello"字符串以UNICODE方式保存。_T和_L的区别在于，_L不管你是以什么方式编译，一律以UNICODE方式保存。

LPSTR：32bit指针指向一个字符串，每个字符占1字节

LPCSTR:32-bit指针指向一个常字符串，每个字符占1字节
LPCTSTR:32-bit指针指向一个常字符串,每字符可能占1字节或2字节，取决于Unicode是否定义
LPTSTR:32-bit指针每字符可能占1字节或2字节，取决于Unicode是否定义

L是表示字符串资源为Unicode的。

比如
wchar_t Str[] = L"Hello World!";
这个就是双子节存储字符了。

_T是一个适配的宏～

当
#ifdef _UNICODE的时候
_T就是L
没有#ifdef _UNICODE的时候
_T就是ANSI的。

比如

LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");
以上两句使得无论是在UNICODE编译条件下都是正确编译的。

而且MS推荐你使用相匹配的字符串函数。
比如处理LPTSTR或者LPCTSTR 的时候，不要用strlen ,而是要用_tcslen

否则在UNICODE的编译条件下，strlen不能处理 wchar_t*的字符串。

T是非常有意思的一个符号（TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...），它表示使用一种中间类型，既不明确表示使用 MBCS，也不明确表示使用 UNICODE。那到底使用哪种字符集?编译的时候才决定

来自：https://www.cnblogs.com/wecfly/p/15469017.html

c++ string 中的编码格式：

在 C++ 中，标准库提供的 std::string 并不直接规定其内部字符编码格式。它只是一个字符容器，通常用于存储以 char 类型表示的字符串。因此，std::string 内部的字符编码取决于你所使用的字符集和编译器的设置。最常见的字符编码是 ASCII 和 UTF-8。

以下是一些关于 C++ 中字符串编码的详细信息：

ASCII：在许多传统和简单的应用中，std::string 内部存储的字符是 ASCII 编码的。ASCII 是一种7位编码方案，每个字符占用一个字节。
UTF-8：这是现代应用程序中最常见的编码方式。UTF-8 是一种变长字符编码，每个字符可以占用 1 到 4 个字节。UTF-8 向后兼容 ASCII，即 ASCII 字符在 UTF-8 中仍然占用一个字节。很多 C++ 程序在处理多语言文本时会使用 UTF-8 编码。
其他编码：虽然较少见，std::string 也可以存储其他编码的字符数据，如 ISO-8859 系列编码。

std::wstring 和 std::u16string 等其他字符串类型：

std::wstring：用于存储宽字符（wchar_t），其大小取决于编译器和平台。在 Windows 上通常是 2 字节，表示 UTF-16 编码。在 Unix 系统（如 Linux 和 macOS）上通常是 4 字节，表示 UTF-32 编码。
std::u16string 和 std::u32string：C++11 引入了这两种字符串类型，分别用于存储 UTF-16 和 UTF-32 编码的字符串数据。它们使用 char16_t 和 char32_t 类型来表示字符。

#include <iostream>
#include <string>

int main() {
std::string ascii_str = "Hello, World!";
std::wstring wide_str = L"Hello, World!";
std::u16string u16_str = u"Hello, World!";
std::u32string u32_str = U"Hello, World!";

std::cout << "std::string (ASCII/UTF-8): " << ascii_str << std::endl;
std::wcout << L"std::wstring (UTF-16/UTF-32): " << wide_str << std::endl;
// For u16string and u32string, use a loop to print each character as there's no direct support in std::cout
std::cout << "std::u16string (UTF-16): ";
for (char16_t c : u16_str) {
std::cout << char(c);
}
std::cout << std::endl;

std::cout << "std::u32string (UTF-32): ";
for (char32_t c : u32_str) {
std::cout << char(c);
}
std::cout << std::endl;

return 0;
}

参考：

posted @ 2024-05-22 11:34 redrobot 阅读(9) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

redrobot

c++ L _T()

公告