nginx配置禁止爬虫配置
1、在配置文件里添加禁止爬虫配置
server {
……………… #添加如下内容即可防止爬虫 if ($http_user_agent ~* "qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapartners-Google|Adsbot-Google|Feedfetcher-Google|Yahoo! Slurp|Yahoo! Slurp China|YoudaoBot|Sosospider|Sogou spider|Sogou web spider|MSNBot|ia_archiver|Tomato Bot") { return 403; }
2、限制同一个ip的访问频率
速率限制主要有2个主要指令,limit_req_zore 和limit_req
1、在nginx.conf里的http{}里加上如下代码: limit_conn_zone $binary_remote_addr zone=perip:10m; limit_conn_zone $server_name zone=perserver:10m; 2、在需要限制并发数和下载带宽的网站配置server{}里加上如下代码: limit_conn perip 2; limit_conn perserver 20; limit_rate 100k; 补充说明下参数: $binary_remote_addr是限制同一客户端ip地址; $server_name是限制同一server最大并发数; limit_conn为限制并发连接数; limit_rate为限制下载速度;