scrapy执行流程

整体流程

- 引擎找到要执行的爬虫,并执行爬虫的 start_requests 方法,并的到一个 迭代器。
- 迭代器循环时会获取Request对象,而request对象中封装了要访问的URL和回调函数。
- 将所有的request对象(任务)放到调度器中,用于以后被下载器下载。

- 下载器去调度器中获取要下载任务(就是Request对象),下载完成后执行回调函数。

- 回到spider的回调函数中,
yield Request()
yield Item()

具体流程

  

posted @   人生不如戏  阅读(1211)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示