2018年1月28日

分布式爬虫的设计策略

摘要: 以下是三种分布式爬虫的设计分析,分布式系统有待进一步了解与学习。 策略一: Slaver端从Master端拿任务(Request/url/ID)进行数据抓取,在抓取数据的同时也生成新任务,并将任务抛给Master。Master端只有一个Redis数据库,负责对Slaver提交的任务进行去重、加入待爬 阅读全文

posted @ 2018-01-28 20:59 niansi 阅读(282) 评论(0) 推荐(0) 编辑

导航