会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
风行天下
天地不仁以万物为刍狗
博客园
首页
新随笔
联系
订阅
管理
2021年11月18日
通用爬虫(Broad Crawls) scrapy
摘要: Scrapy默认对特定爬取进行优化。这些站点一般被一个单独的Scrapy spider进行处理, 不过这并不是必须或要求的(例如,也有通用的爬虫能处理任何给定的站点)。 除了这种爬取完某个站点或没有更多请求就停止的”专注的爬虫”,还有一种通用的爬取类型,其能爬取大量(甚至是无限)的网站, 仅仅受限于
阅读全文
posted @ 2021-11-18 19:04 brady-wang
阅读(449)
评论(0)
推荐(0)
编辑
公告