会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
alunbar
博客园
首页
新随笔
联系
订阅
管理
2018年12月14日
一起学爬虫——一步一步打造爬虫代理池
摘要: 最近在使用爬虫爬取数据时,经常会返回403代码,大致意思是该IP访问过于频繁,被限制访问。限制IP访问网站最常用的反爬手段了,其实破解也很容易,就是在爬取网站是使用代理即可,这个IP被限制了,就使用其他的IP。对于高大上的公司来说,他们基本都使用收费的代理,基本不会有什么问题,比较稳定。像我这样的矮
阅读全文
posted @ 2018-12-14 10:00 alunbar
阅读(1401)
评论(0)
推荐(2)
编辑
公告