python3下的编码检测——chardet

====================================================
chardet 2.1.1 for py3
====================================================

    chardet 是python的第三方库,chardet是一个非常优秀的编码识别模块。但是一直没有python3的版本,
由于自己需要用到,因此试着修改到python3下能够运行。

一、本软件基于chardet-2.1.1,安装python 3的新特性和语法进行修改后修改版,修改时参照了此篇文章:
http://woodpecker.org.cn/diveintopython3/case-study-porting-chardet-to-python-3.html#running2to3

二、但由于版本不同,修改之处也不尽相同,修改点也多于文章中所提之处。
本人测试环境为python3.3。

三、另外,由于python3对于字符串编码的调整,因此对于str类型侦测编码就变得没有意义了,因此,修改过后的版本
是用来检测bytes类型的编码的。

四、测试程序test.py是根据该文章中的编码的来,原软件包中并无此文件。

五、安装时仍用原有安装方式:python setup.py install

六、其他事项参加chartdet的文档或网上文章。

====================================================
***********    佣工7001 2012.12.18       ***********
====================================================
@@@注:本软件一切权利归属原作者,如果有问题,本人概不负责

测试程序运行画面抓图

chardet修改版源码下载

posted @ 2012-12-18 14:26  柒零壹  阅读(1669)  评论(0编辑  收藏  举报