scrapy执行流程

Posted on 2018-04-03 21:47 王将军之武库阅读(115) 评论(0) 编辑收藏举报

def _next_request_from_scheduler(self, spider): fetch一个request，调用http11 handler，client的agent，返回的是deffered。
_handle_downloader_output(）if isinstance(response, Request):如果是请求，继续爬行，调用crawl时会把请求放到调度器
self.crawl(response, spider)
def enqueue_scrape( 请求入队
def _scrape_next(self, spider, slot):
_scrape2
call_spider
handle_spider_output
_process_spidermw_output

刷新页面返回顶部