杨梅冲
每天在想什么呢?

步骤:

WAF & Shield------》选中使用的规则或自建“xxx”----》Rules. ----→Add Rules

name: 取名

type:Regular rule

If a request:matchs the statement

Statement:Single header

Header field name:user-agent

Match type:Matchs regular expression

#拦截规则:拦截ImagesiftBot这种标志的爬虫,如果有其他爬虫:(?i)(ImagesiftBot|aaaa|bbbb|ccc)

Regular expression:(?i)(ImagesiftBot)

 

Action:block

 

但是要小心别将搜索引擎的 Bot给屏蔽了

测试方法:curl -A "Mozilla/5.0 (compatible; ImagesiftBot; +imagesift.com)" "https://www.test.com" -vsq

 

主流网站爬虫机构:https://www.aimaven.vip/article/5264

爬虫特征字符串整理大全:

baiduspider

www.baidu.com/search/spider.html

www.sogou.com/docs/help/webmasters.htm

360spider

haosouspider

bingbot

www.bing.com/bingbot.htm

googlebot

www.google.com/mobile/adsbot.html

www.googlebot.com/bot.html

www.google.com/bot.html

misc.yahoo.com.cn/help.html

yisouspider

bytespider

zhanzhang.toutiao.com

www.yodao.com/help/webmaster/spider

search.msn.com/msnbot.htm

semrushbot

blexbot

ahrefsbot

mj12bot

dotbot

posted on   杨梅冲  阅读(93)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示