会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
肖祥
博客园
首页
新随笔
联系
订阅
管理
2020年9月20日
Scrapy ip代理池
摘要: 一、概述 在众多的网站防爬措施中,有一种是根据ip的访问频率进行限制,即在某一时间段内,当某个ip的访问次数达到一定的阀值时,该ip就会被拉黑、在一段时间内禁止访问。 应对的方法有两种: 1. 降低爬虫的爬取频率,避免IP被限制访问,缺点显而易见:会大大降低爬取的效率。 2. 搭建一个IP代理池,使
阅读全文
posted @ 2020-09-20 15:00 肖祥
阅读(2178)
评论(1)
推荐(0)
编辑
公告