Loading

Qt+ICU识别文本文件编码并合并导出文本

核心部分

识别文本编码,这里使用ICU

核心代码

	/// <summary>
	/// 读取文本文件内容并返回QString
	/// </summary>
	/// <param name="path">文件路径</param>
	/// <returns>文本内容</returns>
	static QString readFile(QString path) {
		// icu识别字符编码
		UErrorCode status = U_ZERO_ERROR;
		UCharsetDetector* detector = ucsdet_open(&status);
		if (U_FAILURE(status)) {
			return "";
		}
		// 读取文件内容
		QFile file(path);
		if (!file.open(QIODevice::ReadOnly)) {
			return "";
		}
		QByteArray data = file.readAll();
		file.close();
		// 识别字符编码
		ucsdet_setText(detector, data.data(), data.size(), &status);
		if (U_FAILURE(status)) {
			return "";
		}
		const UCharsetMatch* match = ucsdet_detect(detector, &status);
		if (U_FAILURE(status)) {
			return "";
		}
		const char* charset = ucsdet_getName(match, &status);
		if (U_FAILURE(status)) {
			return "";
		}
		// 转换编码
		QTextCodec* codec = QTextCodec::codecForName(charset);
		QString text = codec->toUnicode(data);
		// 释放资源
		ucsdet_close(detector);
		return text;
	}

示例

在这里插入图片描述

示例源代码

https://github.com/WindSnowLi/ExportSource

posted @ 2022-09-20 09:52  WindSnowLi  阅读(28)  评论(0编辑  收藏  举报