05 . Nginx的反向代理与负载均衡
Nginx负载均衡
客户端的访问都被代理到后端的一台服务器上,最终会出现性能瓶颈,从而导致效率降低,前端用户的访问速度急速下降,要解决这个问题就需要添加多台httpd,同时承受大量并发连接,每台服务器接收的并发连接降低了,效率就高了,nginx作为代理,在收到客户端的请求时,会分发到不同的后端服务器,但是nginx收到请求之后会分配到那个服务器之上,有什么规律和需求,就需要用调度算法来分配.
upstream语法
# upstream的定义必须在server{..}外定义
upstream <组名称> {
# [调度算法];
server IP:port [weight=<number>] [max_fails=<number>] [fail_timeout=<number>];
server IP:port [weight=<number>] [max_fails=<number>] [fail_timeout=<number>];
server IP:port [weight=<number>] [max_fails=<number>] [fail_timeout=<number>];
}
weight=<number> # 设置服务器的权重值
max_fails=<number> # 检测失败的次数
fail_timeout=<number> # 检测的周期,单位为秒,就是每次检测的间隔时间
max_conns # 限制最大的接受连接数
backup # 预留的备份服务器
down # 当前的server暂时不参与负载均衡
location / {
proxy_pass http://<组名称>
}
调度算法
调度算法 | 概述 |
---|---|
轮训 | 按时间顺序逐一分配到不同的后端服务器(默认) |
weight | 加权轮训,weight值越大,分配到的访问几率越高 |
Ip_hash | 每个请求按访问IP的hash结果分配,这样来自同一IP的固定访问一个后端服务器 |
Url_hash | 按照访问URL的hash结果来分配请求,是每个URL定向到一个后端服务器 |
Least_conn | 最少连接数,那个机器连接数少就分发 |
hash关键数值 | hash自定义key的key |
rr
默认,支持为后端服务器设置权重(weight),默认是1.
upstream linuxidc{
server 10.0.0.77 weight=5;
server 10.0.0.88 weight=10;
}
ip_hash
相同IP地的客户端请求,Nginx会代理到一台后端服务器,方便做网站的session。
upstream favresin{
ip_hash;
server 10.0.0.10:8080;
server 10.0.0.11:8080;
}
least_conn
最少连接,nginx会自动检测后端服务器连接数,代理到最少连接的服务器上.
我们知道轮训算法是把请求平均的转发到各个后端,使他们负载大致相同,这有个前提,就是每个请求所占用的后端时间差不多,如果有些请求时间很长,会导致所有的后端负载较高,这种情况下,把请求转发给连接数较少的后端,能够达到更好的负载均衡效果,这就是least_conn算法.
least_conn算法很简单,首先便利后端集群,比较每个后端的conns/weight,选取该值最小的后端.
如果有多个conns/weight值同为最小的,那么对他们采用加权轮训算法. https://blog.csdn.net/zhangskd/article/details/50242241
fair
按后端服务器的响应时间来分配请求,响应时间短的优先分配,与weight分配策略类似.
upstream favresin{
server 10.0.0.10:8080;
server 10.0.0.11:8080;
fair;
}
url_hash
按访问url的hash结果分配请求,使每个url定向到一个后端服务器,后端服务器为缓存时比较有效。
在upstream中加入hash语句,server语句中不能写入weight等其他参数,hash_method是使用的hash算法.
upstream resinserver{
server 10.0.0.10:7777;
server 10.0.0.11:8888;
hash $request_uri;
hash_method crc32;
}
upstream: # 还可以为每个设备设置状态值,这些状态值的含义分别如下:
down: # 表示单前的server暂时不参与负载.
weight: # 默认为1.weight越大,负载的权重就越大。
max_fails:
# 允许请求失败的次数默认为1.当超过最大次数时,返回proxy_next_upstream 模块定义的错误.
fail_timeout: # max_fails次失败后,暂停的时间。
backup:
# 其它所有的非backup机器down或者忙的时候,请求backup机器。所以这台机器压力会最轻。
# 定义负载均衡设备的Ip及设备状态
upstream bakend{
ip_hash;
server 10.0.0.11:9090 down;
server 10.0.0.11:8080 weight=2;
server 10.0.0.11:6060;
server 10.0.0.11:7070 backup;
}
正向代理
正向代理类似一个跳板机,代理访问外部资源
example 1:
上不了google,可以找一个代理服务器,代理上google,在浏览器中设置相应的代理地址即可,这样由代理去谷歌返回数据,再返回给我们,这样我们就能访问谷歌了: 选项——> 常规——> 网络代理——> 设置——> 手动配置代理——> 写好ip地址端口即可.
example 2
内网服务器无法上外网,可以找能上外网的服务器作为代理,代替上网即可.
# 正向代理的用途:
# (1).访问原来无法访问的资源,如google.
# (2).可以做缓存,加速访问资源.
# (3).对客户端访问授权,上网进行认证.
# (4).代理可以记录用户访问记录(上网行为管理),对外隐藏用户信息.
正向反向代理区别
# 正向代理代理对象是客户端
# 反向代理代理对象是服务端
Nginx代理配置语法
Syntax: proxy_pass URL;
Default: —
Context: location, if in location, limit_except
http://localhost:8000/uri/
http://39.108.140.0:8000/uri/
http://unix:/tmp/backend.socket:/uri/
# 尽可能收集所有头请求,
Syntax: proxy_buffering on | off;
Default:
proxy_buffering on;
Context: http, server, location
# 扩展:
proxy_buffer_size
proxy_buffers
proxy_busy_buffer_size
# 跳转重定向
Syntax: proxy_redirect default;
proxy_redirect off;proxy_redirect redirect replacement;
Default: proxy_redirect default;
Context: http, server, location
# 头信息
Syntax: proxy_set_header field value;
Default: proxy_set_header Host $proxy_host;
proxy_set_header Connection close;
Context: http, server, location
# 扩展:
proxy_hide_header
proxy_set_body
# 代理到后端的TCP连接超时
Syntax: proxy_connect_timeout time;
Default: proxy_connect_timeout 60s;
Context: http, server, location
# 扩展
proxy_read_timeout # 以及建立
proxy_send_timeout # 服务端请求完, 发送给客户端时间
# Proxy常见配置项具体配置如下
vim /etc/nginx/proxy_params
proxy_redirect default;
proxy_set_header Host $http_host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_connect_timeout 30;
proxy_send_timeout 60;
proxy_read_timeout 60;
proxy_buffer_size 32k;
proxy_buffering on;
proxy_buffers 4 128k;
proxy_busy_buffers_size 256k;
proxy_max_temp_file_size 256k;
//具体location实现
location / {
proxy_pass http://127.0.0.1:8080;
include proxy_params;
}
反向代理
反向代理(Reverse Proxy)实际运行方式是指以代理服务器来接收internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上连接的客户端,此时代理服务器对外就表现为一个服务器.(为服务器做代理)
反向代理的用途:
保证内网的安全,组织web攻击,大型网站,通常将反向代理作为公网访问地址,web服务器就是内网.
- 负载均衡,通过反向代理服务器来优化网站的负载.
总结
# 1. 正向代理即是客户端代理,代理客户端,服务端不知道实际发起请求的客户端. (买票的黄牛)
# 2. 反向代理即是服务端代理,代理服务器,客户端不知道实际提供服务的服务器. (租房的代理)
Proxy配置实例
example 1:
客户端通过http://39.108.140.0- proxy主机访问nginx时,以本地页面响应;通过http://39.108.140.0/forum ,proxy主机访问时,代理到后端服务器49.233.69.195 - rearend主机上
vim /etc/nginx/conf.d/default.conf
location /forum {
proxy_pass http://49.233.69.195/;
}
如果location后写自定义的URI地址,在做反向代理时,必须要指定路径;
如果定义location时候加入了~ ~* 这样的模式匹配字符,后面跟了路径,proxy_pass在写时,只能写到服务器地址上,也就是不允许写IP后面的/,否则报语法错误.
location ~ /discuz {
proxy_pass http://49.233.69.195;
}
echo 123 > /usr/share/nginx/html/discuz/index.html
# elinks --dump 39.108.140.0/discuz
此处要注意,如果是按照forum的写法,那么根目录没有forum也会代理成功,但是如果按照discuz写法,就算有discuz目录,没有相应 123 # 文件也会报错403,404之类错误.
systemctl reload nginx
echo you-men > /usr/share/nginx/html/index.html
echo ten-xun > /usr/share/nginx/html/index.html
elinks 39.108.140.0 --dump
you-men
elinks --dump 39.108.140.0/forum
ten-xun
example 2:
客户端访问http://39.108.140.0/discuz,代理到后端服务器http://49.233.69.195的bbs目录下
location /discuz {
proxy_pass http://49.233.69.195/bbs;
}
echo ten-xun_bbs > /usr/share/nginx/html/bbs/index.html
elinks --dump 39.108.140.0/discuz
ten-xun_bbs
example 3:
配置nginx不再响应客户端访问请求,所有访问请求全部代理到后端服务器
location / {
root /usr/share/nginx/html;
index index.html index.htm;
}
将以上location注释,换成匹配到什么目录就代理到什么后端服务器相关的location
Nginx的四层负载均衡
什么是四层负载均衡?
四层负载均衡是基于传输层协议包来封装的(如:TCP/IP),那我们前面使用到的七层是指的应用层,他的组装在四层的基础之上,无论四层还是七层都是指的OSI网络模型。
四层负载均衡应用场景
# 四层+七层来做负载均衡,四层可以保证七层的负载均衡的高可用性;如:nginx就无法保证自己的服务高可用,需要依赖LVS或者keepalive。
# 如:tcp协议的负载均衡,有些请求是TCP协议的(mysql、ssh),或者说这些请求只需要使用四层进行端口的转发就可以了,所以使用四层负载均衡。
小结
# 1、四层负载均衡仅能转发TCP/IP协议、UDP协议、通常用来转发端口,如:tcp/22、udp/53;
# 2、四层负载均衡可以用来解决七层负载均衡端口限制问题;(七层负载均衡最大使用65535个端口号)
# 3、四层负载均衡可以解决七层负载均衡高可用问题;(多台后端七层负载均衡能同事的使用)
# 4、四层的转发效率比七层的高得多,但仅支持tcp/ip协议,不支持http和https协议;
# 5、通常大并发场景通常会选择使用在七层负载前面增加四层负载均衡。
Nginx配置四层负载均衡
注意
1 . 记得编译加上--with-stream模块
2 . 在nginx.conf默认配置文件里面,默认没有stream的配置。stream模块的配置跟http配置是同级的,因此要注意不要写到http里面。
配置数据测试目录
mkdir -p /nginx_test/web{1..2}
echo web1 > /nginx_test/web1/index.html
echo web2 > /nginx_test/web2/index.html
配置nginx
cat conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
stream {
log_format proxy '$remote_addr $remote_port - [$time_local] $status $protocol '
'"$upstream_addr" "$upstream_bytes_sent" "$upstream_connect_time"' ;
access_log /var/log/nginx/proxy.log proxy;
upstream lb {
server 121.36.43.223:81 weight=5 max_fails=3 fail_timeout=30s;
server 121.36.43.223:82 weight=5 max_fails=3 fail_timeout=30s;
}
server {
listen 80;
proxy_connect_timeout 3s;
proxy_timeout 3s;
proxy_pass lb;
}
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
server {
listen 81;
server_name localhost;
location / {
root /nginx_test/web1;
index index.html index.htm;
}
}
server {
listen 82;
server_name localhost;
location / {
root /nginx_test/web2;
index index.html index.htm;
}
}
}
[root@nginx_test ~]# curl 121.36.43.223
web1
[root@nginx_test ~]# curl 121.36.43.223
web2
[root@nginx_test ~]# curl 121.36.43.223
web1
记录后端服务器真实客户端IP
配置Proxy_set_header,实现后端服务器记录真实的客户端IP
vim /etc/nginx/conf.d/default.conf
location /forum {
proxy_pass http://49.233.69.195/;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
# 后端真实服务器是nginx时使用此行配置;
proxy_set_header x-real-ip $remote_addr;
# 后端真实服务器为httpd时使用
# 如果后端真实服务器是httpd,需要修改httpd的配置文件
systemctl reload nginx
如果是httpd需要修改一下配置文件
vim /etc/httpd/conf/httpd.conf
LogFormat "%{x-real-ip}i %l %u %t "%r" %>s %b "%{Referer}i" "
%{User-Agent}i"" combined
}
39.108.140.0 - - [01/Nov/2019:19:31:45 +0800] "GET / HTTP/1.0" 200 8 "-" "ELinks/0.12pre6 (textmode; Linux; -)" "-"
#没有加proxy_set_header后端服务器的日志
..39.108.140.0 - - [01/Nov/2019:19:29:26 +0800] "GET / HTTP/1.0" 200 8 "-" "ELinks/0.12pre6 (textmode; Linux; -)" "47.92.24.137"
#加了proxy_set_header后端服务器的日志