摘要: 两天时间写了个爬虫,问题多多1.正则表达式考虑不完整,数据出现浮点数,整数,没有都有可能,正则表达式不规范要么取不到数据,要么取到错误的数据,由于没有及时检查,导致整个攻击增加没有取到,简直是严重失误,不过也只能这样了2. python 版本更替,2.7和3.3 差别太多,内部编码方式和整个urllib库 都有很多改动,导致网上代码参考价值较小,给整个变成过程造成了阻碍等发现这个问题的时候,基本代码已经写完,再改也来不及了3.事先调研不清楚,LOL数据在很多网站都有,开始写爬虫的时候并没有调查多个网站,而是随便选了一个178作为爬取网站,结果遇到了反爬虫系统(估计是),如果多调查几个网站,说不 阅读全文
posted @ 2014-02-28 10:53 crowinhell 阅读(513) 评论(0) 推荐(0) 编辑