摘要: #今日目标 **拉勾网python开发要求爬虫** 今天要爬取的是北京python开发的薪资水平,招聘要求,福利待遇以及公司的地理位置。 通过实践发现除了必须携带headers之外,拉勾网对ip访问频率也是有限制的。一开始会提示 '访问过于频繁',继续访问则会将ip拉入黑名单。不过一段时间之后会自动从黑名单中移除。 针对这个策略,我们可以对请求频率进行限制,这个弊端就是影响爬虫效率。其次我们... 阅读全文
posted @ 2019-08-01 23:39 Dragon、 阅读(314) 评论(1) 推荐(1) 编辑