反爬虫技术和爬虫特点

防爬规则:
1.按照ip段聚合,5分钟内的ip段(前两位访问量)
2.按照ip段聚合,某个ip,5分钟访问总量
3.按照ip段聚合,某个ip,5分钟内的关键页面访问总量
4.按照ip段聚合,某个ip,5分钟内的ua种类统计
5.按照ip地址聚合,某个ip,5分钟内页面查询不同行程的次数。
6.按照ip地址聚合,某个ip,5分钟内关键页面的访问的cookie数。
7.按照ip地址聚合,某个ip,5分钟内的关键页面最短访问间隔。
8.

爬虫特点:
1.长期,重复爬取数据
2.使用多个代理(up,ip),爬取数据
3.每个ip短时间内爆发较高流量
4.每个ip白天和夜晚的请求次数均衡
5.热门的查询频率更快
6.浏览路径不完整(一次命中回话为其典型代表)

posted @   三号小玩家  阅读(51)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
Title
三号小玩家的 Mail: 17612457115@163.com, 联系QQ: 1359720840 微信: QQ1359720840

喜欢请打赏

扫描二维码打赏

支付宝打赏

点击右上角即可分享
微信分享提示