摘要: 搭建自己的lab实验室,发现这个极大的激发了自己对很多日常问题的敏感度。自学脚本也两个多月了,测试过二维验证码,试过爬新浪微博。这周终于花了一天和两个晚上把这个客户端指南版本写出来了,大概500多行的代码,遇到的问题却很多。现在来分析一下: 1:关于字符编码:我用的python版本是2.7,要想支持中文只要找对方法即可,一般的做法是在文件头加入#coding:utf-8然后再编码解码;而在用BeautifulSoup进行html分析时,为了打印NavigableString,可以是用reqr(),中文打印出来时是unicode编码,我用的Qt的Qstring作为转换显示的; 2:关... 阅读全文
posted @ 2012-11-11 09:47 数据牛仔 阅读(228) 评论(0) 推荐(0) 编辑