摘要: Scrapy架构(各组件的功能)及Scrapy引擎控制数据流的过程 1. Scrapy架构图(绿线是数据流向): □ Scrapy引擎(Engine):引擎负责控制数据流在系统的所有组件中流动,并在相应动作发生时触发事件。 □ 调度器(Scheduler):调度器从引擎接收Request并将它们入队 阅读全文
posted @ 2018-06-30 17:17 doitjust 阅读(169) 评论(0) 推荐(0) 编辑
摘要: scrapy-下载中间件 每个下载中间件组件是定义了以下一个或多个方法的Python类■ process_request(request,spider)■ process_response(request,response,spider)■ process_exception(request,exc 阅读全文
posted @ 2018-06-30 00:24 doitjust 阅读(154) 评论(0) 推荐(0) 编辑