C语言学习：宽字符串与窄字符串的转换

什么也不设置，看一下代码运行结果。

 1 #include <io_utils.h>
 2 #include <string.h>
 3 #include <stdlib.h>
 4 #include <wchar.h>
 5 #include <wctype.h>
 6 #include <locale.h>
 7 
 8 int main() {
 9   // support for wide string
10   {
11     PRINT_BOOL(iswalpha(L'A'));
12     PRINT_BOOL(iswdigit(L'2'));
13 
14     wchar_t *wcs = L"你好 Hello";
15     size_t length = wcslen(wcs);
16     PRINT_INT(length);
17 
18     wchar_t src[] = L"HelloWorld";
19     wchar_t *dest = malloc(sizeof(wchar_t) * 11);
20     wmemset(dest, 0, 11);
21     wmemcpy(dest, src, 11);
22     _putws(dest);
23     wmemcpy(dest + 3, dest + 1, 4);
24     _putws(dest);
25     free(dest);
26   }
27 
28   // conversions
29 //  char *new_locale = setlocale(LC_ALL, "zh_CN.utf8");
30 //  if (new_locale) {
31 //    puts(new_locale);
32 //  }
33 
34   {
35     char mbs[] = "你好";
36     wchar_t wcs[10];
37     mbstowcs(wcs, mbs, 10);
38     wprintf(L"%s\n", wcs);
39     printf("%s\n","dafdasfddsaf");
40   }
41   return 0;
42 }

View Code

可以看到字符串长度是9，但其实是8，中文乱码了。我们的文件编码是utf-8。

设置cmake的编码（可以参考最后一张图片的代码来设置编码），发现字符串的长度现在是对了，但是中文还是乱码。

设置locale，代码如下

 1 #include <io_utils.h>
 2 #include <string.h>
 3 #include <stdlib.h>
 4 #include <wchar.h>
 5 #include <wctype.h>
 6 #include <locale.h>
 7 
 8 int main() {
 9   // support for wide string
10   {
11     PRINT_BOOL(iswalpha(L'A'));
12     PRINT_BOOL(iswdigit(L'2'));
13 
14     wchar_t *wcs = L"你好 Hello";
15     size_t length = wcslen(wcs);
16     PRINT_INT(length);
17 
18     wchar_t src[] = L"HelloWorld";
19     wchar_t *dest = malloc(sizeof(wchar_t) * 11);
20     wmemset(dest, 0, 11);
21     wmemcpy(dest, src, 11);
22     _putws(dest);
23     wmemcpy(dest + 3, dest + 1, 4);
24     _putws(dest);
25     free(dest);
26   }
27 
28   // conversions
29   char *new_locale = setlocale(LC_ALL, "zh_CN.utf8");
30   if (new_locale) {
31     puts(new_locale);
32   }
33 
34   {
35     char mbs[] = "你好";
36     wchar_t wcs[10];
37     mbstowcs(wcs, mbs, 10);
38     wprintf(L"%s\n", wcs);
39     printf("%s\n","dafdasfddsaf");
40   }
41   return 0;
42 }

View Code

结果，完全正确了。

设置CMAKE的编码参数

-DCMAKE_C_FLAGS="UTF-8"

或者在CMakeLists.txt 文件中设置。

posted @ 2023-02-12 12:31 泥古拉斯赵四阅读(177) 评论(0) 编辑收藏举报

刷新页面返回顶部

泥古拉斯赵四

C语言学习：宽字符串与窄字符串的转换

公告