Qt读取文件乱码

转载来自：https://blog.csdn.net/huang1600301017/article/details/121174229

编码问题回顾和总结：
GB2312 ：是对 ASCII 的中文扩展。兼容ASCII；
GBK：包括了 GB2312 的所有内容，同时又增加了近20000个新的汉字（包括繁体字）和符号；
GB18030：在GBK基础上加入少数民族的几千个新字，扩展成GB18030；
Unicode：所有的字符被一视同仁，汉字不再使用“两个扩展ASCII”，而是使用“1个Unicode”，注意，现在的汉字是“一个字符”了，于是，拆字、统计字数这些问题也就自然而然的解决了。但是，这个世界不是理想的，不可能在一夜之间所有的系统都使用Unicode来处理字符，所以Unicode在诞生之日，就必须考虑一个严峻的问题：和ASCII字符集之间的不兼容问题。
我们知道，ASCII字符是单个字节的，比如“A”的ASCII是65。而Unicode是双字节的，比如“A”的Unicode是0065，这就造成了一个非常大的问题：以前处理ASCII的那套机制不能被用来处理Unicode了。
另一个更加严重的问题是，C语言使用'\0'作为字符串结尾，而Unicode里恰恰有很多字符都有一个字节为0，这样一来，C语言的字符串函数将无法正常处理Unicode，除非把世界上所有用C写的程序以及他们所用的函数库全部换掉。
于是，比Unicode更伟大的东东诞生了，之所以说它更伟大是因为它让Unicode不再存在于纸上，而是真实的存在于我们大家的电脑中。那就是：UTF。
UTF= UCS Transformation Format，即UCS转换(传输)格式。
它是将Unicode编码规则和计算机的实际编码对应起来的一个规则。现在流行的UTF有2种：UTF-8和UTF-16。
这两种都是Unicode的编码实现。

    QFile file("2.txt");
    if(!file.open(QIODevice::ReadOnly | QIODevice::Text)) {
        return false;
    }
 
    QTextStream toText(&file);
    toText.setCodec("GBK");//设置文件流编码方式
    //QString str = toText.readAll().trimmed();
    while(!toText.atEnd()) {
        QString str = toText.readLine().trimmed();
        qDebug() << "str = " << str;
    }

posted @ 2022-05-20 23:19 冰糖葫芦很乖阅读(241) 评论(0) 编辑收藏举报

冰糖葫芦很乖

Qt读取文件乱码

搜索

常用链接

最新随笔

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论