摘要: 有时候需要将命令行或者网页上的或者文件中的内容读取出来做些处理,这个时候可能你发现读取出来的内容是其他的编码方式,如\x20等。处理思路如下:下载chardet模块,安装。利用chardet模块检测读取出来的str是什么编码格式的,如‘UTF-8'或者’GB2312‘等。>>> import chardet>>> chardet.detect(a){'confidence': 0.0, 'encoding': None}知道了编码方式后就可以针对他进行解码了,如:>>> a.decode('G 阅读全文
posted @ 2013-08-06 17:16 马僧 阅读(372) 评论(0) 推荐(0) 编辑