linux防止恶意采集攻防战

  这两天ytkah开发的一个中大型项目被人盯上了,网站打开非常慢,查看了一下cpu、内存使用情况,30%左右占用不高,网络上下行就比较大了,IO实时流量达到40MB,IO总流量更是7TB,非常大的数据量了。网站没有提供文件下载,也没有视频,第一反应是被恶意采集了。这个项目有几百万个页面,很多人也想整一个捞点流量。查看log日志,发现有一些ip段瞬时访问量很高,而且访问的是不同的连续的页面,证实自己的判定是正确。如果是cc攻击的话一般就固定几个页面。

服务器IO总流量

  知道了原因就比较好办了,屏蔽那些ip段应该就太平了。将log日志中的ip地址提取出来(剔除本地ip、搜索引擎蜘蛛ip、目标市场ip),然后找这些ip的规律,如果是连续的,可以用ip段进行屏蔽。怎么屏蔽?ytkah刚开始想着用NGINX进行限制,但是没有起到很好的效果,那就用防火墙吧,服务器一般都会有防火墙功能,如果是linux服务器可以用iptables命令(不会写规则的朋友可以参考iptables命令大全),也有一些第三方的服务器控制面板如wdcp,以下是ytkah添加的一些ip段屏蔽规则

iptables规则列表

  写好屏蔽规则以后,再来看实时流量,一下变为几kb,甚至0,网站也可以像之前一样平滑打开,一下整个世界就安静了。做ip屏蔽时一定要特别注意不要将自己的ip屏蔽了,否则你就无法打开网站和服务器了。可以先将自己的ip进行允许,如上图的accept,其他都设为drop。

posted @   ytkah  阅读(256)  评论(0编辑  收藏  举报
编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
历史上的今天:
2015-05-22 如何通过css控制内容显示顺序 第二行的内容优先显示
2015-05-22 《掌上流年》“国内首部微信日记”出版
2015-05-22 Hello Kitty微信主题很可爱?小心财产安全!
网址导航 gg N / G Sitemap

部分内容来源于网络,如有版权问题请联系删除

  
点击右上角即可分享
微信分享提示