2014年1月14日

摘要: 出现乱码的原因是,网页服务端有bug,它硬性使用使用某种特定的编码方案,而并没有按照客户端的请求头的编码要求来发送编码。解决方案:使用chardet来猜测网页编码。1.去chardet官网下载chardet的py源码包。2.把chardet目录从源码包里解压到项目文件夹内。3.通过 import chardet 来引用它,然后: 1 response = None 2 #尝试下载网页 3 try: 4 response = urllib2.urlopen("http://www.baidu.com") 5 except Exception as e: 6 print &qu 阅读全文
posted @ 2014-01-14 14:41 xxxteam 阅读(1733) 评论(0) 推荐(0) 编辑

导航