会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
一葉知秋
知道可以做什么样的人,是成长的基础。
博客园
首页
新随笔
联系
订阅
管理
2015年6月14日
如何让你的scrapy爬虫不再被ban
摘要: 现在很多网站设置了禁止爬虫抓取的策略,那如何让你的scrapy爬虫不在被禁用呢?本文章主要通过一系列的策略做到尽可能避免爬虫被ban。抓取的时候使用随机的user agent、禁用cookies、随机切换代理IP和下载延迟等等的策略来避免网站的反爬虫。
阅读全文
posted @ 2015-06-14 22:50 秋楓
阅读(40009)
评论(21)
推荐(15)
编辑
公告