摘要: 接下来以爬取quote.toscrape.com为例完成一遍Scrapy的抓取流程。 首先创建一个Scrapy项目。打开命令行,输入以下命令: scrapy startproject projectname 即可在当前位置创建一个Scrapy项目。我们创建一个名为tutorial的项目: scrap 阅读全文
posted @ 2018-11-15 20:32 东东欧尼酱 阅读(176) 评论(0) 推荐(0) 编辑
摘要: Scrapy框架的架构图如上。 Scrapy中的数据流由引擎控制,数据流的过程如下: 1.Engine打开一个网站,找到处理该网站的Spider,并向该Spider请求第一个要爬取得URL。 2.Engine从Spider中获取到第一个要爬的URL,并通过Scheduler以Request的形式调度 阅读全文
posted @ 2018-11-15 19:51 东东欧尼酱 阅读(189) 评论(0) 推荐(0) 编辑