个人博客转至:tybai.com

无聊就想打码,打码使我快乐


Fork me on GitHub

python之chardet库

chardet库是python的字符编码检测器,能够检测出各种编码的类型,例如:

1 import chardet
2 import urllib.request
3 
4 testdata = urllib.request.urlopen('http://m2.cn.bing.com/').read()
5 print(chardet.detect(testdata))

运行结果:

{'confidence': 0.99, 'encoding': 'utf-8'}

翻译一下就是:

{'精准度': 99%, 'encoding(编码形式)': 'utf-8'}

没见识到这个库之前所有编码纯属自己的记忆:

# unicode_escape
\u4e2d\u56fd
# gbk或者utf-8 \xd6\xd0\xb9\xfa 中国
# urlencode %e4%b8%ad%e5%9b%bd
# Gb2312 %d6%d0%b9%fa

这些编码纯属需要眼睛辨认再去网上查找编码

现在发现了chardet这个库后方便了很多  

 

posted on 2016-08-29 12:05  TTyb  阅读(909)  评论(0编辑  收藏  举报

导航


不用多久

我就会升职加薪

当上总经理

出任CEO

迎娶白富美

走上人生巅峰

Pulpit rock