会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
英雄莫问出处,富贵当思缘由
博客园
首页
新随笔
联系
订阅
管理
2018年6月5日
爬虫遇到的坑——发现你是爬虫抛出假数据
摘要: 在爬取国外的某个网站的时候,刚开始他们是封ip,优化好ip池,准备大展身手的时候,数据顺利的爬取完毕后,发现数据有重复的。然后研究了一下, 最后的原因是他们的后台发现是爬虫以后,直接给抛出假的数据。上证据: 解决办法: 每个ip的访问次数尽量的少,尽量用多的ip抓取,抓取速度尽量的慢一些。
阅读全文
posted @ 2018-06-05 17:32 淋哥
阅读(2105)
评论(0)
推荐(0)
编辑
公告