会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
silence_cho
博客园
首页
新随笔
联系
订阅
管理
2018年12月27日
(五)爬虫之并发下载
摘要: 当有大量url需要下载时,串行爬取速度较慢,需要使用多线程、多进程进行爬取,以及部署分布式爬虫等 1.多线程爬虫 下面代码中三个线程时,爬取61个url,花费16-25s;五个线程时,花费41-55s。(线程间的切换也消耗时间) 2.多进程爬虫 2.1 多进程 下面代码中两个进程,爬取61个url,
阅读全文
posted @ 2018-12-27 21:58 silence_cho
阅读(445)
评论(0)
推荐(0)
编辑
公告