根据Unicode码生成汉字
最近需要一批汉字字符数据,类似数字字符与ASCII码之间的对应关系,汉字字符与Unicode码之间也存在对应关系。
所以可以遍历Unicode码批量生成汉字。
其中,汉字为宽字符,输出时候注意需要修改成wcout wofstream ,还有使用imbue函数修改区域语言对象,改成chs中文。
locale loc("chs"); wcout.imbue(loc); wchar_t w = 19968; wchar_t* ws = L"汉字"; wcout << w <<ws<< endl; wofstream of("ChineseCharacters.txt"); of.imbue(loc); int cnt = 19968; for (;w <= 0x952F;)//最后一个汉字字符编码 { wcout << w << endl; of <<cnt++<<" "<< w++ << endl; } of.close();
效果如下:
参考: