会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
甚爱必大费,难得之货令人行妨
人这辈子痛苦与快乐是等价的。痛苦时别太痛苦,快乐时别太快乐。这样就够了。
博客园
首页
新随笔
联系
订阅
管理
2010年4月11日
分布式网络爬虫关键技术分析与实现——分布式网络爬虫体系结构设计
摘要: 一、研究所属范围分布式网络爬虫包含多个爬虫,每个爬虫需要完成的任务和单个的爬行器类似,它们从互联网上下载网页,并把网页保存在本地的磁盘,从中抽取URL并沿着这些URL的指向继续爬行。由于并行爬行器需要分割下载任务,可能爬虫会将自己抽取的URL发送给其他爬虫。这些爬虫可能分布在同一个局域网之中,或者分散在不同的地理位置。根据爬虫的分散程度不同,可以把分布式爬行器分成以下两大类:1、基于局域网分布式网...
阅读全文
posted @ 2010-04-11 22:30 小军人
阅读(19526)
评论(15)
推荐(8)
编辑
公告