python抓取数据 常见反爬虫 情况
1.报文头信息:
User-Agent Accept-Language 防盗链 上referer
随机生成不同的User-Agent构造报头
2.加抓取等待时间
每抓取一页都让它随机休息几秒,加入此句代码后,每个时间段都能爬取大量股票数据了。
3.带cookie数据
4.需要登录的网站
登陆的网站 申请大量的账号,然后再爬入,此处涉及模拟登陆、验证码识别
若标题中有“转载”字样,则本文版权归原作者所有。若无转载字样,本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.