会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Apollo
Everything is a file
博客园
首页
新随笔
联系
管理
订阅
文章分类 -
Python
爬虫框架 Scrapy
摘要:Scrapy使用了Twisted异步网络库来处理网络通讯。整体架构大致如下(注:图片来自互联网)Scrapy主要包括了以下组件:引擎,用来处理整个系统的数据流处理,触发事务。调度器,用来接受引擎发过来的请求,压入队列中,并在引擎再次请求的时候返回。下载器,用于下载网页内容,并将网页内容返回给蜘蛛。蜘...
阅读全文
posted @
2015-06-29 21:08
壬子木
阅读(129)
评论(0)
推荐(0)
公告