如何(快捷) 检测/识别/选择 文件编码字符集/乱码的中文到底是用什么编码的

16进制编辑器的Data Inspector 数据检视 数据检查器

https://www.v2ex.com/t/807890

 

Hex Editor

Vscode有个扩展叫Hex Editor,可以编辑,但是编辑功能比较难用。而且没法复制16进制形式,只能复制base64形式和原字符串。

右侧data inspector可以看到采用各种编码对应的字符是什么。我找到的唯二支持检视gb18030(gbk gb2312)编码的编辑器。

 

hxd

有Data Inspector,但是不支持gb系列编码

这个WideChar char16_t,即UTF-16(不严谨地叫做Unicode)编码

There is no support for Asian double byte codepages yet.

 

wxMEdit

没有Data Inspector功能

 

WinHex

没搜到这个UTANSI是什么意思(应该是UTF和ANSI重合了)

支持gbk

 

在线的https://hexed.it/

不支持gb系列编码

 

汉字字符集编码查询

https://www.qqxiuzi.cn/bianma/zifuji.php

 

 

在线文件编码/输入16进制 检测网站

https://abctool.gitlab.io/encoding-detector/index.zh-cn.html?_lang 不靠谱,根本检测不出来,不够智能

 

https://onlinephp.io/mb-detect-encoding

也是不够智能,https://blog.csdn.net/weixin_37281289/article/details/103347920,依赖于$encodings =里输入的顺序,GB2312放在最前边才能正确识别GB2312

 

 

https://www.mimastech.com/charset-detector-free-online-text-files-charset-detector/

检测不对

 

 

https://suip.biz/?act=encoding-converter 不支持gb系列,支持日文

 

http://tools.bugscaner.com/filebianma/

 

 

https://it365.gitlab.io/zh-cn/decode/  不对

 

 

https://www.toolkk.com/tools/file-encode-detect

不对

 

总结来说,在线检测文件编码的网站都不靠谱

不靠谱的原因,大概是很多编码在多个字符集中都能解释,解释为不同的字

同样是C1EC

 

 

python库

https://stackoverflow.com/questions/436220/how-to-determine-the-encoding-of-text

posted @ 2024-02-29 13:13  hrdom  阅读(118)  评论(0编辑  收藏  举报