摘要:
原文地址:http://blog.chinaunix.net/uid-22414998-id-3696649.html 本来是想把这部分内容放到前一篇《数据抓取的艺术(二):数据抓取程序优化》之中。但是随着任务的完成,我越来越感觉到其中深深的趣味,现总结如下: (1)时间 时间是一个与抓取规模相形而 阅读全文
摘要:
原文地址:http://blog.chinaunix.net/uid-22414998-id-3695673.html 续前文:《数据抓取的艺术(一):Selenium+Phantomjs数据抓取环境配置》。程序优化:第一步开始: for i in range(startx,total): for 阅读全文
摘要:
原文地址:http://blog.chinaunix.net/uid-22414998-id-3692113.html?page=3 数据抓取是一门艺术,和其他软件不同,世界上不存在完美的、一致的、通用的抓取工具。为了不同的目的,需要定制不同的代码。不过,我们不必Start from Scratch 阅读全文