欢迎来到Louis的博客

人生三从境界:昨夜西风凋碧树,独上高楼,望尽天涯路。 衣带渐宽终不悔,为伊消得人憔悴。 众里寻他千百度,蓦然回首,那人却在灯火阑珊处。
扩大
缩小

python 检测文本文件的编码

python 编码是个比较坑爹的问题

我们可以通过chardet模块来检查文件的编码,

import chardet
def get_code(file_name):
    with open(file_name,"rb") as f:                 # 二进制打开
        return chardet.detect(f.read(10000))["encoding"]    #此处值读取了10000个字符,适用于较大的文件,可节省内存,具体数值根据文件内容设置,如果文件较小可以不设置读取的字符数,

chardet属于第三方模块,需要安装。

 

posted on 2018-08-04 20:14  Louiszj  阅读(209)  评论(0编辑  收藏  举报

导航