python 检测文本文件的编码
python 编码是个比较坑爹的问题
我们可以通过chardet模块来检查文件的编码,
import chardet def get_code(file_name): with open(file_name,"rb") as f: # 二进制打开 return chardet.detect(f.read(10000))["encoding"] #此处值读取了10000个字符,适用于较大的文件,可节省内存,具体数值根据文件内容设置,如果文件较小可以不设置读取的字符数,
chardet属于第三方模块,需要安装。