Linux10.9 Rewrite配置

域名跳转(重定向)、URL重写(伪静态)、动静分离(跳转域名,并接入CDN实现加速)
rewrite依赖PCRE库
模块:ngx_http_rewrite_module

Nginx的rewrite配置--if

  if指令

格式:if (条件判断) { 具体的rewrite规则 }

  条件举例

条件判断语句由Nginx内置变量、逻辑判断符号和目标字符串三部分组成。
其中,内置变量是Nginx固定的非自定义的变量,如,$request_method, $request_uri等。
逻辑判断符号,有=, !=, ~, ~*, !~, !~*
!表示相反的意思,~为匹配符号,它右侧为正则表达式,区分大小写,而~*为不区分大小写匹配。
目标字符串可以是正则表达式,通常不用加引号,但表达式中有特殊符号时,比如空格、花括号、分号等,需要用单引号引起来。

  示例

if ($request_method = POST)  //当请求的方法为POST时,直接返回405状态码
{
    return 405; //在该示例中并未用到rewrite规则,if中支持用return指令。
}


if ($http_user_agent ~ MSIE) //user_agent带有MSIE字符的请求,直接返回403状态码
{
    return 403;
}

如果想同时限制多个user_agent,还可以写成这样

if ($http_user_agent ~ "MSIE|firefox|spider")
{
    return 403;
}


if(!-f $request_filename)  //当请求的文件不存在,将会执行下面的rewrite规则
{
    rewrite 语句;
}

if($request_uri ~* 'gid=\d{9,12}/')  //\d表示数字,{9,12}表示数字出现的次数是9到12次,如gid=123456789/就是符合条件的。
{
    rewrite 语句;
}

 

Nginx的rewrite配置--break和last

两个指令用法相同,但含义不同,需要放到rewrite规则的末尾,用来控制重写后的链接是否继续被nginx配置执行(主要是rewrite、return指令)。

示例1(连续两条rewrite规则):
server{
    listen 80; 
    server_name test.com;
    root /tmp/123.com;

    rewrite /1.html /2.html ;
    rewrite /2.html /3.html ;
    
}
当我们请求1.html时,最终访问到的是3.html,两条rewrite规则先后执行。

  可以在该server内配置 rewrite_log on   ,在nginx.conf中打开  errorr_log  logs/error.log  notice  只有notice级别才会在errorlog中记录rewrite_log。

示例如下:

[root@localhost ~]# cat /usr/local/nginx/conf/vhost/www.1.com.conf
server {

        listen 80;
        server_name www.1.com;
        root /data/wwwroot/www.1.com;
        index welcome.html;

        rewrite_log on;
        rewrite /1.html /2.html;
        rewrite /2.html /3.html;
}

//打开nginx.conf中error_log notice配置

[root@localhost ~]# /usr/local/nginx/sbin/nginx -t
nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok
nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful
[root@localhost ~]# /usr/local/nginx/sbin/nginx -s reload
[root@localhost ~]# curl -x127.0.0.1:80 www.1.com/1.html
333333
[root@localhost ~]# cat /usr/local/nginx/logs/error.log
... ...
2018/07/19 21:17:13 [notice] 2166#0: *3 "/1.html" matches "/1.html", client: 127.0.0.1, server: www.1.com, request: "GET HTTP://www.1.com/1.html HTTP/1.1", host: "www.1.com"
2018/07/19 21:17:13 [notice] 2166#0: *3 rewritten data: "/2.html", args: "", client: 127.0.0.1, server: www.1.com, request: "GET HTTP://www.1.com/1.html HTTP/1.1", host: "www.1.com"
2018/07/19 21:17:13 [notice] 2166#0: *3 "/2.html" matches "/2.html", client: 127.0.0.1, server: www.1.com, request: "GET HTTP://www.1.com/1.html HTTP/1.1", host: "www.1.com"
2018/07/19 21:17:13 [notice] 2166#0: *3 rewritten data: "/3.html", args: "", client: 127.0.0.1, server: www.1.com, request: "GET HTTP://www.1.com/1.html HTTP/1.1", host: "www.1.com"

  如果在 server 中 rewrite /1.html /2.html 后加 break 或者 last;则第二行不会执行。

  break和last在location {}外部

格式:rewrite xxxxx  break;

示例2(增加break):
server{
    listen 80; 
    server_name test.com;
    root /tmp/123.com;

    rewrite /1.html /2.html break;
    rewrite /2.html /3.html;
}
当我们请求1.html时,最终访问到的是2.html
说明break在此示例中,作用是不再执行break以下的rewrite规则。
但,当配置文件中有location时,它还会去执行location{}段的配置(请求要匹配该location)。
示例3(break后面还有location段):
server{
    listen 80; 
    server_name test.com;
    root /tmp/123.com;

    rewrite /1.html /2.html break;
    rewrite /2.html /3.html;
    location /2.html {
        return 403;
    }
}
当请求1.html时,最终会返回403状态码,说明它去匹配了break后面的location{}配置。

示例2和示例3,可以把break替换为last,它们两者起到的效果一模一样。

  当break和last在location{}里面

示例4(什么都不加):
server{
    listen 80; 
    server_name test.com;
    root /tmp/123.com;
    
    location / {
        rewrite /1.html /2.html;
        rewrite /2.html /3.html;
    }
    location /2.html
    {
        rewrite /2.html /a.html;
    }
    location /3.html
    {
        rewrite /3.html /b.html;
    }
}
当请求/1.html,最终将会访问/b.html,连续执行location /下的两次rewrite,跳转到了/3.html,然后又匹配location /3.html

示例5(增加break):
server{
    listen 80; 
    server_name test.com;
    root /tmp/123.com;
    
    location / {
        rewrite /1.html /2.html break;
        rewrite /2.html /3.html;
    }
    location /2.html
    {
        rewrite /2.html /a.html;
    }
    location /3.html
    {
        rewrite /3.html /b.html;
    }
}
当请求/1.html,最终会访问/2.html
在location{}内部,遇到break,本location{}内以及后面的所有location{}内的所有指令都不再执行。


示例6(增加last):
server{
    listen 80; 
    server_name test.com;
    root /tmp/123.com;
    
    location / {
        rewrite /1.html /2.html last;
        rewrite /2.html /3.html;
    }
    location /2.html
    {
        rewrite /2.html /a.html;
    }
    location /3.html
    {
        rewrite /3.html /b.html;
    }
}
当请求/1.html,最终会访问/a.html
在location{}内部,遇到last,本location{}内后续指令不再执行,而重写后的url再次从头开始,从头到尾匹配一遍规则。
  • 当rewrite规则在location{}外,break和last作用一样,遇到break或last后,其后续的rewrite/return语句不再执行。但后续有location{}的话,还会近一步执行location{}里面的语句,当然前提是请求必须要匹配该location。
  • 当rewrite规则在location{}里,遇到break后,本location{}与其他location{}的所有rewrite/return规则都不再执行。
  • 当rewrite规则在location{}里,遇到last后,本location{}里后续rewrite/return规则不执行,但重写后的url再次从头开始执行所有规则,哪个匹配执行哪个。

Nginx的rewrite配置--return

  该指令一般用于对请求的客户端直接返回响应状态码。在该作用域内return后面的所有nginx配置都是无效的。可以使用在server、location以及if配置中。除了支持跟状态码,还可以跟字符串或者url链接。

return直接返回状态码

示例1:
server{
    listen 80;
    server_name www.111.com;
    return 403;
    rewrite /(.*) /abc/$1;  //该行配置不会被执行。
}

示例2:
server {
.....

if ($request_uri ~ "\.htpasswd|\.bak")
{
    return 404;
    rewrite /(.*) /aaa.txt;  //该行配置不会被执行。
}
//如果下面还有其他配置,会被执行。
.....
}

return返回字符串

示例3:
server{
    listen 80;
    server_name www.aming.com;
    return 200 "hello";
}
说明:如果要想返回字符串,必须要加上状态码,否则会报错。

还可以支持json数据

示例4:
location ^~ /aming {
    default_type application/json ;
    return 200  '{"name":"chyuanliu","id":"100"}';
}

也支持写一个变量

示例5:
location /test {
    return 200 "$host $request_uri";
}

return返回url

示例6:
server{
    listen 80;
    server_name www.111.com;
    return http://www.111.com/123.html;
    rewrite /(.*) /abc/$1;  //该行配置不会被执行。
}
注意:return后面的url必须是以http://或者https://开头的。

生成场景实战

背景:网站被黑了,凡是在百度点击到本网站的请求,全部都跳转到了一个赌博网站。
通过nginx解决:
if ($http_referer ~ 'baidu.com') 
{
    return 200 "<html><script>window.location.href='//$host$request_uri';</script></html>";
}

如果写成:
return http://$host$request_uri; 在浏览器中会提示“重定向的次数过多”。

rewrite规则

格式:rewrite  regex replacement [flag] 

* rewrite配置可以在server、location以及if配置段内生效

* regex是用于匹配URI的正则表达式,其不会匹配到$host(域名)

* replacement是目标跳转的URI,可以以http://或者https://开头,也可以省略掉$host,直接写$request_uri部分(即请求的链接)

* flag,用来设置rewrite对URI的处理行为,其中有break、last、rediect、permanent,其中break和last在前面已经介绍过,
rediect和permanent的区别在于,前者为临时重定向(302),而后者是永久重定向(301),对于用户通过浏览器访问,这两者的效果是一致的。
但是,对于搜索引擎蜘蛛爬虫来说就有区别了,使用301更有利于SEO。所以,建议replacemnet是以http://或者https://开头的flag使用permanent。

  注:regex匹配的URI为域名后的  https://www.cnblogs.com/chyuanliu/p/9327529.html

  

  示例,通常用于域名重定向

location / {
    rewrite /(.*) http://www.aming.com/$1 permanent;
}
说明:.*为正则表达式,用()括起来,在后面的URI中可以调用它,第一次出现的()用$1调用,第二次出现的()用$2调用,以此类推。

location / {
    rewrite /.* http://www.aming.com$request_uri permanent;
}
说明:在replacement中,支持变量,这里的$request_uri就是客户端请求的链接

//request_uri就是除了域名的其余部分

  示例,错误分析

server{
    listen 80;
    server_name www.123.com;
    root /tmp/123.com;
    index index.html;
    rewrite /(.*) /abc/$1 redirect;
}
说明:本例中的rewrite规则有问题,会造连续循环,最终会失败,解决该问题有两个方案。
关于循环次数,经测试发现,curl 会循环50次,chrome会循环80次,IE会循环120次,firefox会循环20次。

方案1:
server{
    listen 80;
    server_name www.123.com;
    root /tmp/123.com;
    index index.html;
    rewrite /(.*) /abc/$1 break;
}
说明:在rewrite中使用break,会避免循环。

方案2:
server{
    listen 80;
    server_name www.123.com;
    root /tmp/123.com;
    index index.html;
    if ($request_uri !~ '^/abc/')
    {
        rewrite /(.*) /abc/$1 redirect;
    }
}
说明:加一个条件限制,也可以避免产生循环

 实例

域名跳转(域名重定向)

示例1(不带条件的):
server{
    listen 80;
    server_name www.1111.com;
    rewrite /(.*) http://www.1111.com/$1 permanent;
    .......
    
}

示例2(带条件的):
server{
    listen 80;
    server_name www.1111.com 1111.com;
    if ($host != 'www.1111.com')
    {
        rewrite /(.*) http://www.1111.com/$1 permanent;
    }
    .......
    
}

示例3(http跳转到https):
server{
    listen 80;
    server_name www.1111.com;
    rewrite /(.*) https://www.1111.com/$1 permanent;
    .......
    
}

示例4(域名访问二级目录)
server{
    listen 80;
    server_name bbs.1111.com;
    rewrite /(.*) http://www.1111.com/bbs/$1 last;
    .......
    
}

示例5(静态请求分离)
server{
    listen 80;
    server_name www.1111.com;
    location ~* ^.+.(jpg|jpeg|gif|css|png|js)$
    {
        rewrite /(.*) http://www.img1111.com/$1 permanent;
    }

    .......
    
}
或者:
server{
    listen 80;
    server_name www.1111.com;
    if ( $uri ~* 'jpg|jpeg|gif|css|png|js$')
    {
        rewrite /(.*) http://img.1111.com/$1 permanent;
    }

    .......
    
}

防盗链

server{
    listen 80;
    server_name www.aminglinux.com;
    location ~* ^.+.(jpg|jpeg|gif|css|png|js|rar|zip|flv)$
    {
        valid_referers none blocked server_names *.aminglinux.com aminglinux.com *.aming.com aming.com;
        if ($invalid_referer)
        {
            rewrite /(.*) http://img.aminglinux.com/images/forbidden.png;
        }
    }

    .......
    
}
说明:*这里是通配,跟正则里面的*不是一个意思,none指的是referer不存在的情况即空referer(curl -e 测试),
      blocked指的是referer头部的值被防火墙或者代理服务器删除或者伪装的情况,
      该情况下,referer头部的值不以http://或者https://开头(curl -e 后面跟的referer不以http://或者https://开头)。
或者:
    location ~* ^.+.(jpg|jpeg|gif|css|png|js|rar|zip|flv)$
    {
        valid_referers none blocked server_names *.aminglinux.com *.aming.com aminglinux.com aming.com;
        if ($invalid_referer)
        {
            return 403;
        }
    }

  带上none不指定referer也可以访问,不带的话,空referer不能访问。

  不带blocked,如果referer不以   http://或者https:// 开头不能访问。带blocked,referer不以   http://或者https:// 开头能访问。

伪静态

示例7(discuz伪静态):
location /  {
    rewrite ^([^\.]*)/topic-(.+)\.html$ $1/portal.php?mod=topic&topic=$2 last;
    rewrite ^([^\.]*)/forum-(\w+)-([0-9]+)\.html$ $1/forum.php?mod=forumdisplay&fid=$2&page=$3 last;
    rewrite ^([^\.]*)/thread-([0-9]+)-([0-9]+)-([0-9]+)\.html$ $1/forum.php?mod=viewthread&tid=$2&extra=page%3D$4&page=$3 last;
    rewrite ^([^\.]*)/group-([0-9]+)-([0-9]+)\.html$ $1/forum.php?mod=group&fid=$2&page=$3 last;
    rewrite ^([^\.]*)/space-(username|uid)-(.+)\.html$ $1/home.php?mod=space&$2=$3 last;
    rewrite ^([^\.]*)/(fid|tid)-([0-9]+)\.html$ $1/index.php?action=$2&value=$3 last;
}

多个条件并且

  nginx不支持if嵌套,使用定义变量去标记。

location /{
    set $rule 0;
    if ($document_uri !~ '^/abc')
    {
        set $rule "${rule}1";
    }
    if ($http_user_agent ~* 'ie6|firefox')
    {
       set $rule "${rule}2";
    }
    if ($rule = "012")
    {
        rewrite /(.*) /abc/$1 redirect;
    }
}

  

 

posted @ 2018-07-19 14:46  chyuanliu  阅读(287)  评论(0编辑  收藏  举报