Nginx特性验证-反向代理/负载均衡/页面缓存/URL重定向

原文发表于cu2016-08-25

参考文档:

  1. Nginx 反向代理、负载均衡、页面缓存、URL重写等:http://freeloda.blog.51cto.com/2033581/1288553
  2. Nginx反向代理/负载均衡简单配置:http://www.cnblogs.com/jacktang/p/3669115.html
  3. Nginx反向代理,后端web如何获取真实ip: http://www.bubuko.com/infodetail-822723.html

 本文针对Nginx几个常用特性做简单验证(高手请略过),通过简单的验证熟悉配置。

一.环境准备

1. 操作系统

CentOS-7-x86_64-Everything-1511

2. Nginx版本

Nginx-1.11.3: http://nginx.org/download/nginx-1.11.3.tar.gz

安装配置请见:https://www.cnblogs.com/netonline/p/7327409.html

3. 拓扑图

  1. Proxy服务器为采用VMware ESXi虚拟出的1台服务器,已安装并启动nginx服务,前段访问地址x.140.246.55(真实的互联网ip地址,隐去),后端地址172.19.200.215;
  2. Web1服务器为采用Docker技术生成的1台服务器,已安装并启动nginx服务,ip地址172.19.200.241;
  3. Web2同Web1服务器,ip地址172.19.200.242;
  4. 设置web1/2测试页面(路径参考nginx安装步骤),以方便后续查看验证结果,如下:

    web1:

    [root@e84e8f6ba866 ~]# echo "<h1>Welcome to test site web1!</h1>"  > /usr/local/nginx/html/index.html

    web2:

    [root @56f610597bcd ~]# echo "<h1>Welcome to test site web2!</h1>" > /usr/local/nginx/html/index.html

二.反向代理

1. 反向代理说明

指令:proxy_pass

语法:proxy_pass URL

使用字段:location字段

#URL可以是被代理服务器的ip地址,ip地址+端口或者被映射的url

2. 反向代理配置

#被代理服务器暂时设置web1;
#重要:重新加载nginx配置文件,重新加载之前可以通过” /usr/local/nginx/sbin/nginx -t -c /usr/local/nginx/conf/nginx.conf”测试配置文件修改是否正确
[root@localhost ~]# cd /usr/local/nginx/conf/
[root@localhost conf]# vim nginx.conf
        location / {
             proxy_pass http://172.19.200.241;
        }
[root@localhost conf]# service nginx reload

3. 验证

方式1:通过浏览器访问代理服务器,返回结果是web1的测试页面,如下:

方式2:通过curl命令访问代理服务器,返回结果是web1的测试页面,如下:

[root@localhost ~]# curl http://x.140.246.55

4. 查看web服务器的访问日志

#从访问日志看到,客户端ip都是nginx代理服务器的后端ip,后端web服务器并没有捕获到真实客户端ip
[root@e84e8f6ba866 ~]# cd /usr/local/nginx/logs/
[root@e84e8f6ba866 logs]# tail -f access.log 
172.19.200.215 - - [24/Aug/2016:09:20:49 +0000] "GET / HTTP/1.0" 304 0 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36"
172.19.200.215 - - [24/Aug/2016:09:20:49 +0000] "GET / HTTP/1.0" 304 0 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36"
172.19.200.215 - - [24/Aug/2016:09:20:52 +0000] "GET / HTTP/1.0" 200 36 "-" "curl/7.29.0"
172.19.200.215 - - [24/Aug/2016:09:20:53 +0000] "GET / HTTP/1.0" 200 36 "-" "curl/7.29.0"

5. web服务器捕获真实客户端ip

1)修改nginx代理服务器配置

#”proxy_set_header X-Real-IP $remote_addr”指令将发送到被代理服务器的请求头重新定义或者增加一些字段;此值可以是一个文本,变量或它们的组合;
#proxy_set_header在指定的字段中没有定义时会从它的上级字段继承。
[root@localhost ~]# cd /usr/local/nginx/conf/
[root@localhost conf]# vim nginx.conf
        location / {
             proxy_set_header X-Real-IP $remote_addr;
             proxy_pass http://172.19.200.241;

        }
[root@localhost conf]# service nginx reload

2)修改web服务器配置

#”set_real_ip_from IP”指令在http字段内,但在server字段之外IP为nginx代理服务器可访问到后端web服务器的地址。
[root@e84e8f6ba866 ~]# cd /usr/local/nginx/conf/
[root@e84e8f6ba866 conf]# vim nginx.conf
set_real_ip_from 172.19.200.215;
[root@e84e8f6ba866 conf]# service nginx reload

6. 验证捕获真实客户端ip

#在客户端使用curl命令访问代理服务器,查看后端web服务器访问日志;
#从访问日志看到,后端web服务器已捕获到真实客户端ip
[root@e84e8f6ba866 logs]# tail -f access.log

三.负载均衡

1. 负载均衡说明

1)upstream模块

upstream是Nginx的HTTP Upstream模块,此模块通过一个简单的调度算法来实现客户端ip到后端服务器的负载均衡。

2)upstream支持的负载均衡算法

(1)轮询(默认)

每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某台服务器宕机,故障系统被自动剔除,使用户访问不受影响。可以通过weight 指定轮询权值,weight值越大,分配到的访问机率越高,主要用于后端每个服务器性能不均的情况下。

(2)ip_hash

每个请求按访问ip的hash结果分配,这样来自同一个IP的访客固定访问一个后端服务器,可有效解决动态网页存在的session共享问题

(3)fair

比上面两个更加智能的负载均衡算法。此算法可以依据页面大小和加载时间长短智能地进行负载均衡,即根据后端服务器的响应时间来分配请求,响应时间短的优先分配。Nginx本身不支持fair,如果需要使用这种调度算法,必须下载Nginx的upstream_fair模块。

(4)url_hash

此方法按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,可进一步提高后端缓存服务器的效率。Nginx本身不支持url_hash,如果需要使用这种调度算法,必须安装Nginx 的hash软件包。

3)upstream支持的状态参数

在upstream模块中,可以在每个后端服务器后设置负载均衡调度中的状态。常用的状态有:

(1)down

表示当前的server暂时不参与负载均衡。

(2)backup

预留的备份机器,当其他所有的非backup机器出现故障或者忙的时候,才会请求backup机器,因此这台机器的压力最轻。

(3)max_fails

允许请求失败的次数,默认为1。当超过最大次数时,返回proxy_next_upstream 模块定义的错误。

(4)fail_timeout

在经历了max_fails次失败后,暂停服务的时间,max_fails可以和fail_timeout一起使用。

2. 负载均衡配置

[root@localhost ~]# cd /usr/local/nginx/conf/

#upstream模块在http字段内, server模块之外;upstream指定的负载均衡名可自定义,后面location字段中”proxy_pass”指令调用自定义的负载均衡名即可;
#weight值默认可不用配置,如果后端服务器性能不均,可以通过weight值负载调度;
#可以通过backup状态参数预留备份服务器;
#默认使用轮询调度算法,如果使用ip_hash调度算法,后端服务器的负载均衡调度状态不能是backup
[root@localhost conf]# vim nginx.conf
    upstream test.backend {
             # ip_hash;
             server 172.19.200.241 weight=1;
             server 172.19.200.242 weight=1;
             # server 127.0.0.1:8080 backup;
     }

    server {
        listen       80;
        server_name  localhost;

        #charset koi8-r;
        #access_log  logs/host.access.log  main;

        location / {
             proxy_set_header X-Real-IP $remote_addr;
             proxy_pass http://test.backend;
        }
    }

[root@localhost conf]# service nginx reload

3. 验证

采用curl命令访问代理服务器,交替返回web1与web2的测试页面,如下:

[root@localhost ~]# date ; curl http://x.140.246.55

四.页面缓存

1. 页面缓存说明

1)proxy_cache_path

指令:proxy_cache_path

语法:proxy_cache_path path [levels=number] keys_zone=zone_name:zone_size [inactive=time] [max_size=size];

使用字段:http字段,server字段之外

#指令指定缓存的路径和一些其他参数,缓存的数据存储在文件中,缓存文件使用代理url的哈希值作为关键字与文件名;

#levels参数指定指定目录结构,指定缓存的子目录数,可以使用任意的1位或2位数字作为目录结构,但最多只能是三级目录,格式如X, X:X,或X:X:X,转换为指令如"2", "2:2", "1:1:2"等;

#所有活动的key和元数据存储在共享的内存池中,这个区域用keys_zone参数指定。共享池的名称自定义,共享池的大小可用"m"代表单位;内存池的大小按照缓存页面数的比例进行设置,一个页面(文件)的元数据大小按照操作系统来定,如FreeBSD/i386下为64字节,FreeBSD/amd64下为128字节;

#inactive参数指定缓存超时时间,指定时间内没有被请求的数据则删除,默认inactive为10分钟;

#一个名为cache manager的进程控制磁盘的缓存大小,它被用来删除不活动的缓存与控制缓存大小,这些都在max_size参数中定义,当目前缓存的值超出max_size指定的值之后,超过其大小后最少使用数据(LRU替换算法)将被删除。

2)proxy_cache

指令:proxy_cache

语法:proxy_cache zone_name;

使用字段:http, server, location

#设置一个缓存区域的(自定义)名称,一个相同的区域可以在不同的地方使用;

#缓存指令依赖代理缓冲区(buffers),如果proxy_buffers设置为off,缓存不会生效。

3)proxy_cache_valid

指令:proxy_cache_valid

语法: proxy_cache_valid reply_code [reply_code …] time;

使用字段: http, server, location

#为不同的应答设置不同的缓存时间,如:"proxy_cache_valid 200 302 10m;"

即应答代码为200和302时,设置缓存时间为10分钟;

#如果只定义时间:如:"proxy_cache_valid 5m;" 那只对代码为200, 301和302的应答进行缓存;

#可以使用any参数应答,如:" proxy_cache_valid any 1m;"

2. 页面缓存变量说明

如果不在代理服务器的配置文件中配置页面缓存变量,则验证时查看结果不方便。

1)$server_addr

服务器地址,在完成一次系统调用后可确定这个值;如果要绕开系统调用,则必须在listen中指定地址并且使用bind参数。

2)$upstream_cache_status

MISS:未命中

EXPIRED – expired:请求被传送到后端

UPDATING – expired:由于proxy/fastcgi_cache_use_stale正在更新,将使用旧的应答

STALE – expired:由于proxy/fastcgi_cache_use_stale超期,后端将得到过期的应答

HIT:命中

3. 页面缓存配置

[root@localhost ~]# cd /usr/local/nginx/conf/

#缓存路径自定义,注意key_zone定义的共享内存池与location字段中”proxy_cache”对应;
#两个”add_header”指令增加了头部,如不设置,验证时不方便查看结果;
#”proxy_buffering”如果是”off”,则缓存不生效
[root@localhost conf]# vim nginx.conf
    proxy_cache_path /usr/local/nginx/cache/testcache levels=1:2 keys_zone=testcache:20m max_size=1g;

    upstream test.backend {
             # ip_hash;
             server 172.19.200.241;
             server 172.19.200.242;
             # server 127.0.0.1:8080 backup
     }

    server {
        listen       80;
        server_name  localhost;

        #charset koi8-r;
        #access_log  logs/host.access.log  main;

        add_header X-Via $server_addr;
        add_header X-Cache $upstream_cache_status;

        location / {
             proxy_set_header X-Real-IP $remote_addr;
             proxy_pass http://test.backend;
             # proxy_buffering off;
             proxy_cache testcache;
             proxy_cache_valid 200 10m;
        }
    }

#在”proxy_cache_path”中定义的路径需要补充完整,并赋予权限
[root@localhost conf]# mkdir -p /usr/local/nginx/cache/testcache
[root@localhost conf]# chown www:www /usr/local/nginx/cache
[root@localhost conf]# service nginx reload

4. 验证

采用浏览器访问代理服务器,F5不断刷新,返回web2(或者web1)的测试页面,如下:

  1. 按F12可调用浏览器的开发调试工具,选择Network选项,可看到Response Headers中,绿色方框中提示:"X-Cache: HIT" (与代理服务器配置文件中" add_header"有关);
  2. 另注意General中,绿色方框中提示:" Status Code:304 Not Modified"。

五.URL重定向

URL重写比较复杂,这里只简单的验证一下重定向。

1. URL重写模块说明

重写模块Rewrite允许使用正则表达式重新URI,但需要PCRE的支持,并且可根据相关变量重定向和选择不同的配置。

如果rewrite指令在server字段中指定,那么将在被请求的location确定之前执行;如果在指令执行后所选择的location中有其他的重写规则,那么指令也被执行。如果在location中执行这个指令产生了新的URI,那么location又一次确定了新的URI,这样的循环可最多执行10次,超出后nginx将返回500错误。

2. 重定向配置

重定向验证方案:将客户端到web1上的请求重定向到web2。

设计:

  1. 将web2从负载均衡器中取消,负载均衡器只保留web1;
  2. (option) 将nginx反向代理服务有关页面缓存的设置取消,防止干扰验证结果;
  3. 在web1 的配置文件中设置重定向规则。

1)Nginx反向代理服务配置

[root@localhost ~]# cd /usr/local/nginx/conf/

[root@localhost conf]# vim nginx.conf
    upstream test.backend {
             # ip_hash;
             server 172.19.200.241 weight=1;
             # server 172.19.200.242 weight=1;
             # server 127.0.0.1:8080 backup
     }

    server {
        listen       80;
        server_name  localhost;

        #charset koi8-r;
        #access_log  logs/host.access.log  main;

        location / {
             proxy_set_header X-Real-IP $remote_addr;
             proxy_pass http://test.backend;
        }

[root@localhost conf]# service nginx reload

2)被代理服务器web1配置

[root@e84e8f6ba866 ~]# cd /usr/local/nginx/conf/

[root@e84e8f6ba866 conf]# vim nginx.conf
        location / {
            root   html;
            index  index.html index.htm index.php;
            rewrite ^/ http://172.19.200.242;
        }

[root@e84e8f6ba866 conf]# service nginx reload

3. 验证

  1. 在客户端浏览器访问反向代理服务器:http://x.140.246.55
  2. 返回结果已重定向到web2(这里客户端能访问到172.19.200.0网段,如果访问不到,浏览器地址栏重定向到新的地址,但测试页面返回错误);
  3. 使用开发调试工具可看到,访问反向代理服务器时,状态码为"302 Moved Temporarily",返回地址已重定向到"172.19.200.242",web2的地址;
  4. 重定向后的页面返回状态码为"200 OK (from cache)"。

posted @ 2017-09-19 15:02  Netonline  阅读(1851)  评论(0编辑  收藏  举报