feisky

云计算、虚拟化与Linux技术笔记
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

Python获取字符串的编码

Posted on 2012-12-07 12:18  feisky  阅读(1882)  评论(0编辑  收藏  举报

chardet可以来帮助我们检测字符串的编码类型,使用如下:

  1. s ="utf-8 字符串"
  2. chardet.detect(s)

得到的结果如:

  1. {'confidence':0.87624999999999997,'encoding':'utf-8'}

这里需要提醒一下,因为字符串本身就有可能包含多种编码,因此chardet给出一个可信度(confidence),需要用户自己去判断和使用。但不管怎么,有总比没有强。

 

无觅相关文章插件,快速提升流量