ruby

领取游戏新手卡来http://5433.com

导航

2010年12月19日 #

识别和拒绝爬虫的访问

摘要: 有相当多的爬虫对网站会造成非常高的负载,因此识别爬虫的来源IP是很容易的事情。最简单的办法就是用netstat检查80端口的连接:C代码netstat -nt | grep youhostip:80 | awk '{print $5}' | awk -F":" '{print $1}'| sort | uniq -c | sort -r -nnetstat -nt | grep youhostip:80 | awk '{print $5}' | awk -F":" '{print $1}'| sort | uniq -c | sort -r -n这行shell可以按照80端口连接数量对来源IP 阅读全文

posted @ 2010-12-19 11:49 最初的模样 阅读(4049) 评论(0) 推荐(1) 编辑