关于Unicode和乱码恢复的基本原理

Unicode是个包含了字符集、编码方案的统一码
如果要转换编码,就要先从原始编码转换到Unicode,然后从Unicode再转换到目标编码

假设现在 有一个日文程序在中文系统下生成了乱码文件名,文件名被复制到utf-8的txt里面以后要如何还原呢?
1,将utf-8 转换成 gbk ,也就是先转Unicode,再从Unicode转gbk
2,将第一步的gbk字符转Unicode,并设置源编码为cp932
3,将上一步得到的Unicode转成 utf-8。

posted @ 2022-06-17 05:16  鱼肉真好吃  阅读(709)  评论(0编辑  收藏  举报