摘要: 边学边写代码,记录下来。这段代码用于批量抓取主站下所有子网页中符合特定尺寸要求的的图片文件,支持中断。原理很简单:使用BeautifulSoup4分析网页,获取网页和元素,对集合反复弹栈入栈,对集合进行筛选下载。具体代码如下:import osimport sysimport timeimport ... 阅读全文
posted @ 2014-11-07 15:16 xshrim 阅读(2411) 评论(0) 推荐(0) 编辑