Scrapy突破反爬虫的限制
摘要:
7-1 爬虫和反爬的对抗过程以及策略基本概念爬虫:自动获取网站数据的程序,关键是批量的获取反爬虫:使用技术手段防止爬虫程序的方法误伤:反爬技术将普通用户识别为爬虫,如果误伤过高,效果再好也不能用一般ip地址禁止是不太可能被使用的成本:反爬虫需要的人力和机器成本拦截:成功拦截爬虫,一般拦截率越高,误伤 阅读全文
posted @ 2018-10-17 21:17 可能是小林吧 阅读(326) 评论(0) 推荐(0) 编辑