Fork me on GitHub

根据Unicode码生成汉字

最近需要一批汉字字符数据,类似数字字符与ASCII码之间的对应关系,汉字字符与Unicode码之间也存在对应关系。

所以可以遍历Unicode码批量生成汉字。

其中,汉字为宽字符,输出时候注意需要修改成wcout wofstream  ,还有使用imbue函数修改区域语言对象,改成chs中文。

   locale loc("chs");
    wcout.imbue(loc);

    wchar_t w = 19968;
    wchar_t* ws = L"汉字";
    wcout << w <<ws<< endl;

    wofstream of("ChineseCharacters.txt");
    of.imbue(loc);
    int cnt = 19968;
    for (;w <= 0x952F;)//最后一个汉字字符编码
    {
        wcout << w << endl;
        of <<cnt++<<"    "<< w++ << endl;
    }
    of.close();

效果如下:

 

 参考:

http://tieba.baidu.com/p/4176260500

posted @ 2018-07-31 17:27  hellowOOOrld  阅读(480)  评论(0编辑  收藏  举报