摘要: 说明 : 本文参照了 "官网" 的 dmoz 爬虫例子。 不过这个例子有些年头了,而 dmoz.org 的网页结构已经不同以前。 所以我对 也相应地进行了修改 。 概要 : 本文提出了scrapy 的三个入门应用场景 1. 爬取单页 2. 根据目录页面,爬取所有指向的页面 3. 爬取第一页,然后根据 阅读全文
posted @ 2016-08-30 12:13 罗兵 阅读(3081) 评论(0) 推荐(1) 编辑