URL重定向

原文发表于cu：2016-08-25

参考文档：

Nginx 反向代理、负载均衡、页面缓存、URL重写等：http://freeloda.blog.51cto.com/2033581/1288553
Nginx反向代理/负载均衡简单配置：http://www.cnblogs.com/jacktang/p/3669115.html
Nginx反向代理，后端web如何获取真实ip： http://www.bubuko.com/infodetail-822723.html

本文针对Nginx几个常用特性做简单验证(高手请略过)，通过简单的验证熟悉配置。

一．环境准备

1. 操作系统

CentOS-7-x86_64-Everything-1511

2. Nginx版本

Nginx-1.11.3: http://nginx.org/download/nginx-1.11.3.tar.gz

安装配置请见：https://www.cnblogs.com/netonline/p/7327409.html

3. 拓扑图

Proxy服务器为采用VMware ESXi虚拟出的1台服务器，已安装并启动nginx服务，前段访问地址x.140.246.55(真实的互联网ip地址，隐去)，后端地址172.19.200.215；
Web1服务器为采用Docker技术生成的1台服务器，已安装并启动nginx服务，ip地址172.19.200.241；
Web2同Web1服务器，ip地址172.19.200.242；
设置web1/2测试页面(路径参考nginx安装步骤)，以方便后续查看验证结果，如下：

web1:

[root@e84e8f6ba866 ~]# echo "<h1>Welcome to test site web1!</h1>" > /usr/local/nginx/html/index.html

web2:

[root @56f610597bcd ~]# echo "<h1>Welcome to test site web2!</h1>" > /usr/local/nginx/html/index.html

二．反向代理

1. 反向代理说明

指令：proxy_pass

语法：proxy_pass URL

使用字段：location字段

#URL可以是被代理服务器的ip地址，ip地址+端口或者被映射的url

2. 反向代理配置

#被代理服务器暂时设置web1；
#重要：重新加载nginx配置文件，重新加载之前可以通过” /usr/local/nginx/sbin/nginx -t -c /usr/local/nginx/conf/nginx.conf”测试配置文件修改是否正确
[root@localhost ~]# cd /usr/local/nginx/conf/
[root@localhost conf]# vim nginx.conf
        location / {
             proxy_pass http://172.19.200.241;
        }
[root@localhost conf]# service nginx reload

3. 验证

方式1：通过浏览器访问代理服务器，返回结果是web1的测试页面，如下：

方式2：通过curl命令访问代理服务器，返回结果是web1的测试页面，如下：

[root@localhost ~]# curl http://x.140.246.55

4. 查看web服务器的访问日志

#从访问日志看到，客户端ip都是nginx代理服务器的后端ip，后端web服务器并没有捕获到真实客户端ip
[root@e84e8f6ba866 ~]# cd /usr/local/nginx/logs/
[root@e84e8f6ba866 logs]# tail -f access.log 
172.19.200.215 - - [24/Aug/2016:09:20:49 +0000] "GET / HTTP/1.0" 304 0 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36"
172.19.200.215 - - [24/Aug/2016:09:20:49 +0000] "GET / HTTP/1.0" 304 0 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36"
172.19.200.215 - - [24/Aug/2016:09:20:52 +0000] "GET / HTTP/1.0" 200 36 "-" "curl/7.29.0"
172.19.200.215 - - [24/Aug/2016:09:20:53 +0000] "GET / HTTP/1.0" 200 36 "-" "curl/7.29.0"

5. web服务器捕获真实客户端ip

1）修改nginx代理服务器配置

#”proxy_set_header X-Real-IP $remote_addr”指令将发送到被代理服务器的请求头重新定义或者增加一些字段；此值可以是一个文本，变量或它们的组合；
#proxy_set_header在指定的字段中没有定义时会从它的上级字段继承。
[root@localhost ~]# cd /usr/local/nginx/conf/
[root@localhost conf]# vim nginx.conf
        location / {
             proxy_set_header X-Real-IP $remote_addr;
             proxy_pass http://172.19.200.241;

        }
[root@localhost conf]# service nginx reload

2）修改web服务器配置

#”set_real_ip_from IP”指令在http字段内，但在server字段之外，IP为nginx代理服务器可访问到后端web服务器的地址。
[root@e84e8f6ba866 ~]# cd /usr/local/nginx/conf/
[root@e84e8f6ba866 conf]# vim nginx.conf
set_real_ip_from 172.19.200.215;
[root@e84e8f6ba866 conf]# service nginx reload

6. 验证捕获真实客户端ip

#在客户端使用curl命令访问代理服务器，查看后端web服务器访问日志；
#从访问日志看到，后端web服务器已捕获到真实客户端ip
[root@e84e8f6ba866 logs]# tail -f access.log

三．负载均衡

1. 负载均衡说明

1）upstream模块

upstream是Nginx的HTTP Upstream模块，此模块通过一个简单的调度算法来实现客户端ip到后端服务器的负载均衡。

2）upstream支持的负载均衡算法

（1）轮询（默认）

每个请求按时间顺序逐一分配到不同的后端服务器，如果后端某台服务器宕机，故障系统被自动剔除，使用户访问不受影响。可以通过weight 指定轮询权值，weight值越大，分配到的访问机率越高，主要用于后端每个服务器性能不均的情况下。

（2）ip_hash

每个请求按访问ip的hash结果分配，这样来自同一个IP的访客固定访问一个后端服务器，可有效解决动态网页存在的session共享问题。

（3）fair

比上面两个更加智能的负载均衡算法。此算法可以依据页面大小和加载时间长短智能地进行负载均衡，即根据后端服务器的响应时间来分配请求，响应时间短的优先分配。Nginx本身不支持fair，如果需要使用这种调度算法，必须下载Nginx的upstream_fair模块。

（4）url_hash

此方法按访问url的hash结果来分配请求，使每个url定向到同一个后端服务器，可进一步提高后端缓存服务器的效率。Nginx本身不支持url_hash，如果需要使用这种调度算法，必须安装Nginx 的hash软件包。

3）upstream支持的状态参数

在upstream模块中，可以在每个后端服务器后设置负载均衡调度中的状态。常用的状态有：

（1）down

表示当前的server暂时不参与负载均衡。

（2）backup

预留的备份机器，当其他所有的非backup机器出现故障或者忙的时候，才会请求backup机器，因此这台机器的压力最轻。

（3）max_fails

允许请求失败的次数，默认为1。当超过最大次数时，返回proxy_next_upstream 模块定义的错误。

（4）fail_timeout

在经历了max_fails次失败后，暂停服务的时间，max_fails可以和fail_timeout一起使用。

2. 负载均衡配置

[root@localhost ~]# cd /usr/local/nginx/conf/

#upstream模块在http字段内， server模块之外；upstream指定的负载均衡名可自定义，后面location字段中”proxy_pass”指令调用自定义的负载均衡名即可；
#weight值默认可不用配置，如果后端服务器性能不均，可以通过weight值负载调度；
#可以通过backup状态参数预留备份服务器；
#默认使用轮询调度算法，如果使用ip_hash调度算法，后端服务器的负载均衡调度状态不能是backup
[root@localhost conf]# vim nginx.conf
    upstream test.backend {
             # ip_hash;
             server 172.19.200.241 weight=1;
             server 172.19.200.242 weight=1;
             # server 127.0.0.1:8080 backup;
     }

    server {
        listen       80;
        server_name  localhost;

        #charset koi8-r;
        #access_log  logs/host.access.log  main;

        location / {
             proxy_set_header X-Real-IP $remote_addr;
             proxy_pass http://test.backend;
        }
    }

[root@localhost conf]# service nginx reload

3. 验证

采用curl命令访问代理服务器，交替返回web1与web2的测试页面，如下：

[root@localhost ~]# date ; curl http://x.140.246.55

四．页面缓存

1. 页面缓存说明

1）proxy_cache_path

指令：proxy_cache_path

语法：proxy_cache_path path [levels=number] keys_zone=zone_name:zone_size [inactive=time] [max_size=size];

使用字段：http字段，server字段之外

#指令指定缓存的路径和一些其他参数，缓存的数据存储在文件中，缓存文件使用代理url的哈希值作为关键字与文件名；

#levels参数指定指定目录结构，指定缓存的子目录数，可以使用任意的1位或2位数字作为目录结构，但最多只能是三级目录，格式如X, X:X,或X:X:X，转换为指令如"2", "2:2", "1:1:2"等；

#所有活动的key和元数据存储在共享的内存池中，这个区域用keys_zone参数指定。共享池的名称自定义，共享池的大小可用"m"代表单位；内存池的大小按照缓存页面数的比例进行设置，一个页面（文件）的元数据大小按照操作系统来定，如FreeBSD/i386下为64字节，FreeBSD/amd64下为128字节；

#inactive参数指定缓存超时时间，指定时间内没有被请求的数据则删除，默认inactive为10分钟；

#一个名为cache manager的进程控制磁盘的缓存大小，它被用来删除不活动的缓存与控制缓存大小，这些都在max_size参数中定义，当目前缓存的值超出max_size指定的值之后，超过其大小后最少使用数据（LRU替换算法）将被删除。

2）proxy_cache

指令：proxy_cache

语法：proxy_cache zone_name;

使用字段：http, server, location

#设置一个缓存区域的（自定义）名称，一个相同的区域可以在不同的地方使用；

#缓存指令依赖代理缓冲区(buffers)，如果proxy_buffers设置为off，缓存不会生效。

3）proxy_cache_valid

指令：proxy_cache_valid

语法： proxy_cache_valid reply_code [reply_code …] time;

使用字段： http, server, location

#为不同的应答设置不同的缓存时间，如："proxy_cache_valid 200 302 10m;"

即应答代码为200和302时，设置缓存时间为10分钟；

#如果只定义时间：如："proxy_cache_valid 5m;" 那只对代码为200, 301和302的应答进行缓存；

#可以使用any参数应答，如：" proxy_cache_valid any 1m;"

2. 页面缓存变量说明

如果不在代理服务器的配置文件中配置页面缓存变量，则验证时查看结果不方便。

1）$server_addr

服务器地址，在完成一次系统调用后可确定这个值；如果要绕开系统调用，则必须在listen中指定地址并且使用bind参数。

2）$upstream_cache_status

MISS：未命中

EXPIRED – expired：请求被传送到后端

UPDATING – expired：由于proxy/fastcgi_cache_use_stale正在更新，将使用旧的应答

STALE – expired：由于proxy/fastcgi_cache_use_stale超期，后端将得到过期的应答

HIT：命中

3. 页面缓存配置

[root@localhost ~]# cd /usr/local/nginx/conf/

#缓存路径自定义，注意key_zone定义的共享内存池与location字段中”proxy_cache”对应；
#两个”add_header”指令增加了头部，如不设置，验证时不方便查看结果；
#”proxy_buffering”如果是”off”，则缓存不生效
[root@localhost conf]# vim nginx.conf
    proxy_cache_path /usr/local/nginx/cache/testcache levels=1:2 keys_zone=testcache:20m max_size=1g;

    upstream test.backend {
             # ip_hash;
             server 172.19.200.241;
             server 172.19.200.242;
             # server 127.0.0.1:8080 backup
     }

    server {
        listen       80;
        server_name  localhost;

        #charset koi8-r;
        #access_log  logs/host.access.log  main;

        add_header X-Via $server_addr;
        add_header X-Cache $upstream_cache_status;

        location / {
             proxy_set_header X-Real-IP $remote_addr;
             proxy_pass http://test.backend;
             # proxy_buffering off;
             proxy_cache testcache;
             proxy_cache_valid 200 10m;
        }
    }

#在”proxy_cache_path”中定义的路径需要补充完整，并赋予权限
[root@localhost conf]# mkdir -p /usr/local/nginx/cache/testcache
[root@localhost conf]# chown www:www /usr/local/nginx/cache
[root@localhost conf]# service nginx reload

4. 验证

采用浏览器访问代理服务器，F5不断刷新，返回web2（或者web1）的测试页面，如下：

按F12可调用浏览器的开发调试工具，选择Network选项，可看到Response Headers中，绿色方框中提示："X-Cache: HIT" （与代理服务器配置文件中" add_header"有关）；
另注意General中，绿色方框中提示：" Status Code:304 Not Modified"。

五．URL重定向

URL重写比较复杂，这里只简单的验证一下重定向。

1. URL重写模块说明

重写模块Rewrite允许使用正则表达式重新URI，但需要PCRE库的支持，并且可根据相关变量重定向和选择不同的配置。

如果rewrite指令在server字段中指定，那么将在被请求的location确定之前执行；如果在指令执行后所选择的location中有其他的重写规则，那么指令也被执行。如果在location中执行这个指令产生了新的URI，那么location又一次确定了新的URI，这样的循环可最多执行10次，超出后nginx将返回500错误。

2. 重定向配置

重定向验证方案：将客户端到web1上的请求重定向到web2。

设计：

将web2从负载均衡器中取消，负载均衡器只保留web1；
(option) 将nginx反向代理服务有关页面缓存的设置取消，防止干扰验证结果；
在web1 的配置文件中设置重定向规则。

1）Nginx反向代理服务配置

[root@localhost ~]# cd /usr/local/nginx/conf/

[root@localhost conf]# vim nginx.conf
    upstream test.backend {
             # ip_hash;
             server 172.19.200.241 weight=1;
             # server 172.19.200.242 weight=1;
             # server 127.0.0.1:8080 backup
     }

    server {
        listen       80;
        server_name  localhost;

        #charset koi8-r;
        #access_log  logs/host.access.log  main;

        location / {
             proxy_set_header X-Real-IP $remote_addr;
             proxy_pass http://test.backend;
        }

[root@localhost conf]# service nginx reload

2）被代理服务器web1配置

[root@e84e8f6ba866 ~]# cd /usr/local/nginx/conf/

[root@e84e8f6ba866 conf]# vim nginx.conf
        location / {
            root   html;
            index  index.html index.htm index.php;
            rewrite ^/ http://172.19.200.242;
        }

[root@e84e8f6ba866 conf]# service nginx reload

3. 验证

在客户端浏览器访问反向代理服务器：http://x.140.246.55
返回结果已重定向到web2（这里客户端能访问到172.19.200.0网段，如果访问不到，浏览器地址栏重定向到新的地址，但测试页面返回错误）；
使用开发调试工具可看到，访问反向代理服务器时，状态码为"302 Moved Temporarily"，返回地址已重定向到"172.19.200.242"，web2的地址；
重定向后的页面返回状态码为"200 OK (from cache)"。

posted @ 2017-09-19 15:02 Netonline 阅读(1943) 评论(0) 收藏举报

刷新页面返回顶部

Nginx特性验证-反向代理/负载均衡/页面缓存/URL重定向

一．环境准备

1. 操作系统

2. Nginx版本

3. 拓扑图

二．反向代理

1. 反向代理说明

2. 反向代理配置

3. 验证

4. 查看web服务器的访问日志

5. web服务器捕获真实客户端ip

1）修改nginx代理服务器配置

2）修改web服务器配置

6. 验证捕获真实客户端ip

三．负载均衡

1. 负载均衡说明

1）upstream模块

2）upstream支持的负载均衡算法

（1）轮询（默认）

（2）ip_hash

（3）fair

（4）url_hash

3）upstream支持的状态参数

（1）down

（2）backup

（3）max_fails

（4）fail_timeout

2. 负载均衡配置

3. 验证

四．页面缓存

1. 页面缓存说明

1）proxy_cache_path

2）proxy_cache

3）proxy_cache_valid

2. 页面缓存变量说明

1）$server_addr

2）$upstream_cache_status

3. 页面缓存配置

4. 验证

五．URL重定向

URL重写比较复杂，这里只简单的验证一下重定向。

1. URL重写模块说明

2. 重定向配置

1）Nginx反向代理服务配置

2）被代理服务器web1配置

3. 验证

公告