Linux10.9 Rewrite配置
域名跳转(重定向)、URL重写(伪静态)、动静分离(跳转域名,并接入CDN实现加速)
rewrite依赖PCRE库
模块:ngx_http_rewrite_module
Nginx的rewrite配置--if
if指令
格式:if (条件判断) { 具体的rewrite规则 }
条件举例
条件判断语句由Nginx内置变量、逻辑判断符号和目标字符串三部分组成。 其中,内置变量是Nginx固定的非自定义的变量,如,$request_method, $request_uri等。 逻辑判断符号,有=, !=, ~, ~*, !~, !~* !表示相反的意思,~为匹配符号,它右侧为正则表达式,区分大小写,而~*为不区分大小写匹配。 目标字符串可以是正则表达式,通常不用加引号,但表达式中有特殊符号时,比如空格、花括号、分号等,需要用单引号引起来。
示例
if ($request_method = POST) //当请求的方法为POST时,直接返回405状态码 { return 405; //在该示例中并未用到rewrite规则,if中支持用return指令。 } if ($http_user_agent ~ MSIE) //user_agent带有MSIE字符的请求,直接返回403状态码 { return 403; } 如果想同时限制多个user_agent,还可以写成这样 if ($http_user_agent ~ "MSIE|firefox|spider") { return 403; } if(!-f $request_filename) //当请求的文件不存在,将会执行下面的rewrite规则 { rewrite 语句; } if($request_uri ~* 'gid=\d{9,12}/') //\d表示数字,{9,12}表示数字出现的次数是9到12次,如gid=123456789/就是符合条件的。 { rewrite 语句; }
Nginx的rewrite配置--break和last
两个指令用法相同,但含义不同,需要放到rewrite规则的末尾,用来控制重写后的链接是否继续被nginx配置执行(主要是rewrite、return指令)。 示例1(连续两条rewrite规则): server{ listen 80; server_name test.com; root /tmp/123.com; rewrite /1.html /2.html ; rewrite /2.html /3.html ; } 当我们请求1.html时,最终访问到的是3.html,两条rewrite规则先后执行。
可以在该server内配置 rewrite_log on ,在nginx.conf中打开 errorr_log logs/error.log notice 只有notice级别才会在errorlog中记录rewrite_log。
示例如下:
[root@localhost ~]# cat /usr/local/nginx/conf/vhost/www.1.com.conf server { listen 80; server_name www.1.com; root /data/wwwroot/www.1.com; index welcome.html; rewrite_log on; rewrite /1.html /2.html; rewrite /2.html /3.html; } //打开nginx.conf中error_log notice配置 [root@localhost ~]# /usr/local/nginx/sbin/nginx -t nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful [root@localhost ~]# /usr/local/nginx/sbin/nginx -s reload [root@localhost ~]# curl -x127.0.0.1:80 www.1.com/1.html 333333 [root@localhost ~]# cat /usr/local/nginx/logs/error.log ... ... 2018/07/19 21:17:13 [notice] 2166#0: *3 "/1.html" matches "/1.html", client: 127.0.0.1, server: www.1.com, request: "GET HTTP://www.1.com/1.html HTTP/1.1", host: "www.1.com" 2018/07/19 21:17:13 [notice] 2166#0: *3 rewritten data: "/2.html", args: "", client: 127.0.0.1, server: www.1.com, request: "GET HTTP://www.1.com/1.html HTTP/1.1", host: "www.1.com" 2018/07/19 21:17:13 [notice] 2166#0: *3 "/2.html" matches "/2.html", client: 127.0.0.1, server: www.1.com, request: "GET HTTP://www.1.com/1.html HTTP/1.1", host: "www.1.com" 2018/07/19 21:17:13 [notice] 2166#0: *3 rewritten data: "/3.html", args: "", client: 127.0.0.1, server: www.1.com, request: "GET HTTP://www.1.com/1.html HTTP/1.1", host: "www.1.com"
如果在 server 中 rewrite /1.html /2.html 后加 break 或者 last;则第二行不会执行。
break和last在location {}外部
格式:rewrite xxxxx break; 示例2(增加break): server{ listen 80; server_name test.com; root /tmp/123.com; rewrite /1.html /2.html break; rewrite /2.html /3.html; } 当我们请求1.html时,最终访问到的是2.html 说明break在此示例中,作用是不再执行break以下的rewrite规则。 但,当配置文件中有location时,它还会去执行location{}段的配置(请求要匹配该location)。
示例3(break后面还有location段): server{ listen 80; server_name test.com; root /tmp/123.com; rewrite /1.html /2.html break; rewrite /2.html /3.html; location /2.html { return 403; } } 当请求1.html时,最终会返回403状态码,说明它去匹配了break后面的location{}配置。 示例2和示例3,可以把break替换为last,它们两者起到的效果一模一样。
当break和last在location{}里面
示例4(什么都不加): server{ listen 80; server_name test.com; root /tmp/123.com; location / { rewrite /1.html /2.html; rewrite /2.html /3.html; } location /2.html { rewrite /2.html /a.html; } location /3.html { rewrite /3.html /b.html; } } 当请求/1.html,最终将会访问/b.html,连续执行location /下的两次rewrite,跳转到了/3.html,然后又匹配location /3.html 示例5(增加break): server{ listen 80; server_name test.com; root /tmp/123.com; location / { rewrite /1.html /2.html break; rewrite /2.html /3.html; } location /2.html { rewrite /2.html /a.html; } location /3.html { rewrite /3.html /b.html; } } 当请求/1.html,最终会访问/2.html 在location{}内部,遇到break,本location{}内以及后面的所有location{}内的所有指令都不再执行。 示例6(增加last): server{ listen 80; server_name test.com; root /tmp/123.com; location / { rewrite /1.html /2.html last; rewrite /2.html /3.html; } location /2.html { rewrite /2.html /a.html; } location /3.html { rewrite /3.html /b.html; } } 当请求/1.html,最终会访问/a.html 在location{}内部,遇到last,本location{}内后续指令不再执行,而重写后的url再次从头开始,从头到尾匹配一遍规则。
- 当rewrite规则在location{}外,break和last作用一样,遇到break或last后,其后续的rewrite/return语句不再执行。但后续有location{}的话,还会近一步执行location{}里面的语句,当然前提是请求必须要匹配该location。
- 当rewrite规则在location{}里,遇到break后,本location{}与其他location{}的所有rewrite/return规则都不再执行。
- 当rewrite规则在location{}里,遇到last后,本location{}里后续rewrite/return规则不执行,但重写后的url再次从头开始执行所有规则,哪个匹配执行哪个。
Nginx的rewrite配置--return
该指令一般用于对请求的客户端直接返回响应状态码。在该作用域内return后面的所有nginx配置都是无效的。可以使用在server、location以及if配置中。除了支持跟状态码,还可以跟字符串或者url链接。
return直接返回状态码
示例1: server{ listen 80; server_name www.111.com; return 403; rewrite /(.*) /abc/$1; //该行配置不会被执行。 } 示例2: server { ..... if ($request_uri ~ "\.htpasswd|\.bak") { return 404; rewrite /(.*) /aaa.txt; //该行配置不会被执行。 } //如果下面还有其他配置,会被执行。 ..... }
return返回字符串
示例3: server{ listen 80; server_name www.aming.com; return 200 "hello"; } 说明:如果要想返回字符串,必须要加上状态码,否则会报错。 还可以支持json数据 示例4: location ^~ /aming { default_type application/json ; return 200 '{"name":"chyuanliu","id":"100"}'; } 也支持写一个变量 示例5: location /test { return 200 "$host $request_uri"; }
return返回url
示例6: server{ listen 80; server_name www.111.com; return http://www.111.com/123.html; rewrite /(.*) /abc/$1; //该行配置不会被执行。 } 注意:return后面的url必须是以http://或者https://开头的。
生成场景实战
背景:网站被黑了,凡是在百度点击到本网站的请求,全部都跳转到了一个赌博网站。 通过nginx解决: if ($http_referer ~ 'baidu.com') { return 200 "<html><script>window.location.href='//$host$request_uri';</script></html>"; } 如果写成: return http://$host$request_uri; 在浏览器中会提示“重定向的次数过多”。
rewrite规则
格式:rewrite regex replacement [flag] * rewrite配置可以在server、location以及if配置段内生效 * regex是用于匹配URI的正则表达式,其不会匹配到$host(域名) * replacement是目标跳转的URI,可以以http://或者https://开头,也可以省略掉$host,直接写$request_uri部分(即请求的链接) * flag,用来设置rewrite对URI的处理行为,其中有break、last、rediect、permanent,其中break和last在前面已经介绍过, rediect和permanent的区别在于,前者为临时重定向(302),而后者是永久重定向(301),对于用户通过浏览器访问,这两者的效果是一致的。 但是,对于搜索引擎蜘蛛爬虫来说就有区别了,使用301更有利于SEO。所以,建议replacemnet是以http://或者https://开头的flag使用permanent。
注:regex匹配的URI为域名后的 https://www.cnblogs.com/chyuanliu/p/9327529.html
示例,通常用于域名重定向
location / { rewrite /(.*) http://www.aming.com/$1 permanent; } 说明:.*为正则表达式,用()括起来,在后面的URI中可以调用它,第一次出现的()用$1调用,第二次出现的()用$2调用,以此类推。 location / { rewrite /.* http://www.aming.com$request_uri permanent; } 说明:在replacement中,支持变量,这里的$request_uri就是客户端请求的链接 //request_uri就是除了域名的其余部分
示例,错误分析
server{ listen 80; server_name www.123.com; root /tmp/123.com; index index.html; rewrite /(.*) /abc/$1 redirect; } 说明:本例中的rewrite规则有问题,会造连续循环,最终会失败,解决该问题有两个方案。 关于循环次数,经测试发现,curl 会循环50次,chrome会循环80次,IE会循环120次,firefox会循环20次。 方案1: server{ listen 80; server_name www.123.com; root /tmp/123.com; index index.html; rewrite /(.*) /abc/$1 break; } 说明:在rewrite中使用break,会避免循环。 方案2: server{ listen 80; server_name www.123.com; root /tmp/123.com; index index.html; if ($request_uri !~ '^/abc/') { rewrite /(.*) /abc/$1 redirect; } } 说明:加一个条件限制,也可以避免产生循环
实例
域名跳转(域名重定向)
示例1(不带条件的): server{ listen 80; server_name www.1111.com; rewrite /(.*) http://www.1111.com/$1 permanent; ....... } 示例2(带条件的): server{ listen 80; server_name www.1111.com 1111.com; if ($host != 'www.1111.com') { rewrite /(.*) http://www.1111.com/$1 permanent; } ....... } 示例3(http跳转到https): server{ listen 80; server_name www.1111.com; rewrite /(.*) https://www.1111.com/$1 permanent; ....... } 示例4(域名访问二级目录) server{ listen 80; server_name bbs.1111.com; rewrite /(.*) http://www.1111.com/bbs/$1 last; ....... } 示例5(静态请求分离) server{ listen 80; server_name www.1111.com; location ~* ^.+.(jpg|jpeg|gif|css|png|js)$ { rewrite /(.*) http://www.img1111.com/$1 permanent; } ....... } 或者: server{ listen 80; server_name www.1111.com; if ( $uri ~* 'jpg|jpeg|gif|css|png|js$') { rewrite /(.*) http://img.1111.com/$1 permanent; } ....... }
防盗链
server{ listen 80; server_name www.aminglinux.com; location ~* ^.+.(jpg|jpeg|gif|css|png|js|rar|zip|flv)$ { valid_referers none blocked server_names *.aminglinux.com aminglinux.com *.aming.com aming.com; if ($invalid_referer) { rewrite /(.*) http://img.aminglinux.com/images/forbidden.png; } } ....... } 说明:*这里是通配,跟正则里面的*不是一个意思,none指的是referer不存在的情况即空referer(curl -e 测试), blocked指的是referer头部的值被防火墙或者代理服务器删除或者伪装的情况, 该情况下,referer头部的值不以http://或者https://开头(curl -e 后面跟的referer不以http://或者https://开头)。 或者: location ~* ^.+.(jpg|jpeg|gif|css|png|js|rar|zip|flv)$ { valid_referers none blocked server_names *.aminglinux.com *.aming.com aminglinux.com aming.com; if ($invalid_referer) { return 403; } }
带上none不指定referer也可以访问,不带的话,空referer不能访问。
不带blocked,如果referer不以 http://或者https:// 开头不能访问。带blocked,referer不以 http://或者https:// 开头能访问。
伪静态
示例7(discuz伪静态): location / { rewrite ^([^\.]*)/topic-(.+)\.html$ $1/portal.php?mod=topic&topic=$2 last; rewrite ^([^\.]*)/forum-(\w+)-([0-9]+)\.html$ $1/forum.php?mod=forumdisplay&fid=$2&page=$3 last; rewrite ^([^\.]*)/thread-([0-9]+)-([0-9]+)-([0-9]+)\.html$ $1/forum.php?mod=viewthread&tid=$2&extra=page%3D$4&page=$3 last; rewrite ^([^\.]*)/group-([0-9]+)-([0-9]+)\.html$ $1/forum.php?mod=group&fid=$2&page=$3 last; rewrite ^([^\.]*)/space-(username|uid)-(.+)\.html$ $1/home.php?mod=space&$2=$3 last; rewrite ^([^\.]*)/(fid|tid)-([0-9]+)\.html$ $1/index.php?action=$2&value=$3 last; }
多个条件并且
nginx不支持if嵌套,使用定义变量去标记。
location /{ set $rule 0; if ($document_uri !~ '^/abc') { set $rule "${rule}1"; } if ($http_user_agent ~* 'ie6|firefox') { set $rule "${rule}2"; } if ($rule = "012") { rewrite /(.*) /abc/$1 redirect; } }