Linux下Nginx配置

目录

1、全局块

1.1、user指令

用于配置运行Nginx服务器的worker进程的用户和用户组。使用user指令可以指定启动运行工作进程的用户及用户组,这样对于系统的权限访问控制的更加精细,也更加安全。

语法 user user [group]
默认值 nobody
位置 全局块

该属性也可以在编译的时候指定,语法如下./configure --user=user --group=group,如果两个地方都进行了设置,最终生效的是配置文件中的配置。
设置一个用户信息"www"

user  www www;

1.2、worker_processes指令

master_process:用来指定是否开启工作进程。

语法 master_process on|off;
默认值 master_process on;
位置 全局块

worker_processes:用于配置Nginx生成工作进程的数量,这个是Nginx服务器实现并发处理服务的关键所在。理论上来说workder process的值越大,可以支持的并发处理量也越多,但事实上这个值的设定是需要受到来自服务器自身的限制,建议将该值和服务器CPU的内核数保存一致。

语法 worker_processes num/auto;
默认值 1
位置 全局块

1.3、include用来引入其他配置文件,使Nginx的配置更加灵活

语法 include file;
默认值
位置 any

1.4、events块

  • accept_mutex:用来设置Nginx网络连接序列化
语法 accept_mutex on|off;
默认值 accept_mutex off;
位置 events

这个配置主要可以用来解决常说的"惊群"问题。大致意思是在某一个时刻,客户端发来一个请求连接,Nginx后台是以多进程的工作模式,也就是说有多个worker进程会被同时唤醒,但是最终只会有一个进程可以获取到连接,如果每次唤醒的进程数目太多,就会影响Nginx的整体性能。如果将上述值设置为on(开启状态),将会对多个Nginx进程接收连接进行序列号,一个个来唤醒接收,就防止了多个进程对连接的争抢。

  • multi_accept:用来设置是否允许同时接收多个网络连接
语法 multi_accept on|off;
默认值 multi_accept off;
位置 events

如果multi_accept被禁止了,nginx一个工作进程只能同时接受一个新的连接。否则,一个工作进程可以同时接受所有的新连接

  • worker_connections:用来配置单个worker进程最大的连接数
语法 worker_connections number;
默认值 worker_commections 512;
位置 events

这里的连接数不仅仅包括和前端用户建立的连接数,而是包括所有可能的连接数。另外,number值不能大于操作系统支持打开的最大文件句柄数量。

  • use:用来设置Nginx服务器选择哪种事件驱动来处理网络消息。
语法 use method;
默认值 根据操作系统定
位置 events

注意:此处所选择事件处理模型是Nginx优化部分的一个重要内容,method的可选值有select/poll/epoll/kqueue等,之前在准备centos环境的时候,我们强调过要使用linux内核在2.6以上,就是为了能使用epoll函数来优化Nginx。

  • events指令配置实例

打开Nginx的配置文件 nginx.conf,添加如下配置

events{
  accept_mutex on;
  multi_accept on;
  worker_commections 1024;
  use epoll;
}

1.5、http块

1.5.1、定义MIME-Type

我们都知道浏览器中可以显示的内容有HTML、XML、GIF等种类繁多的文件、媒体等资源,浏览器为了区分这些资源,就需要使用MIME Type。所以说MIME Type是网络资源的媒体类型。Nginx作为web服务器,也需要能够识别前端请求的资源类型。

在Nginx的配置文件中,默认有两行配置

include mime.types;
default_type application/octet-stream;

(1)default_type:用来配置Nginx响应前端请求默认的MIME类型。

语法 default_type mime-type;
默认值 default_type text/plain;
位置 http、server、location

在default_type之前还有一句include mime.types,include之前我们已经介绍过,相当于把mime.types文件中MIMT类型与相关类型文件的文件后缀名的对应关系加入到当前的配置文件中。

举例来说明:

有些时候请求某些接口的时候需要返回指定的文本字符串或者json字符串,如果逻辑非常简单或者干脆是固定的字符串,那么可以使用nginx快速实现,这样就不用编写程序响应请求了,可以减少服务器资源占用并且响应性能非常快。

如何实现:

location /get_text {
  #这里也可以设置成text/plain
    default_type text/html;
    return 200 "This is nginx's text";
}
location /get_json{
    default_type application/json;
    return 200 '{"name":"TOM","age":18}';
}

1.5.2、自定义服务日志

Nginx中日志的类型分access.log、error.log。

access.log:用来记录用户所有的访问请求。

error.log:记录nginx本身运行时的错误信息,不会记录用户的访问请求。

Nginx服务器支持对服务日志的格式、大小、输出等进行设置,需要使用到两个指令,分别是access_log和log_format指令。

(1)access_log:用来设置用户访问日志的相关属性。

语法 access_log path[format[buffer=size]]
默认值 access_log logs/access.log combined;
位置 http, server, location

(2)log_format:用来指定日志的输出格式。

语法 log_format name [escape=default|json|none] string....;
默认值 log_format combined "...";
位置 http

1.5.3、其他配置指令

(1)sendfile:用来设置Nginx服务器是否使用sendfile()传输文件,该属性可以大大提高Nginx处理静态资源的性能

语法 sendfile on|off;
默认值 sendfile off;
位置 http、server、location

(2)keepalive_timeout:用来设置长连接的超时时间。
由于HTTP是一种无状态协议,客户端向服务端发送一个TCP请求,服务端响应完毕后断开连接。
如何客户端向服务端发送多个请求,每个请求都需要重新创建一次连接,效率相对来说比较多,使用keepalive模式,可以告诉服务器端在处理完一个请求后保持这个TCP连接的打开状态,若接收到来自这个客户端的其他请求,服务端就会利用这个未被关闭的连接,而不需要重新创建一个新连接,提升效率,但是这个连接也不能一直保持,这样的话,连接如果过多,也会是服务端的性能下降,这个时候就需要我们进行设置其的超时时间。

语法 keepalive_timeout time;
默认值 keepalive_timeout 75s;
位置 http、server、location

(3)keepalive_requests:用来设置一个keep-alive连接使用的次数。

语法 keepalive_requests number;
默认值 keepalive_requests 100;
位置 http、server、location

2、静态资源部署

2.1、Nginx静态资源概述

通过浏览器发送一个HTTP请求实现从客户端发送请求到服务器端获取所需要内容后并把内容回显展示在页面的一个过程。这个时候,我们所请 求的内容就分为两种类型,一类是静态资源、一类是动态资源。
静态资源即指在服务器端真实存在并且能直接拿来展示的一些文件,比如常见的html页面、css文件、js文件、图 片、视频等资源;
动态资源即指在服务器端真实存在但是要想获取需要经过一定的业务逻辑处理,根据不同的条件展示在页面不同这 一部分内容,比如说报表数据展示、根据当前登录用户展示相关具体数据等资源;

2.1.1、Nginx静态资源的配置指令

2.1.1.1、listen指令

listen:用来配置监听端口。

语法 listen address[:port] [default_server]...;
listen port [default_server]...;
默认值 listen *:80 | *:8000
位置 server
示例:
listen 127.0.0.1:8000; # listen localhost:8000 监听指定的IP和端口
listen 127.0.0.1;    # 监听指定IP的所有端口
listen 8000;         # 监听指定端口上的连接
listen *:8000;         # 监听指定端口上的连接

default_server属性是标识符,用来将此虚拟主机设置成默认主机。所谓的默认主机指的是如果没有匹配到对应的address:port,则会默认执行的。如果不指定默认使用的是第一个server。

server{
  listen 8080;
  server_name 127.0.0.1;
  location /{
    root html;
    index index.html;
  }
}
server{
  listen 8080 default_server;
  server_name localhost;
  default_type text/plain;
  return 444 'This is a error request';
}

2.1.1.2、server_name指令

server_name:用来设置虚拟主机服务名称。

127.0.0.1 、 localhost 、域名[www.baidu.com | www.jd.com]

语法 server_name name ...;
name可以提供多个中间用空格分隔
默认值 server_name "";
位置 server

关于server_name的配置方式有三种,分别是:

精确匹配
通配符匹配
正则表达式匹配

配置方式一:精确匹配

如:

server {
  listen 80;
  server_name www.itcast.cn www.itheima.cn;
  ...
}

配置方式二:使用通配符配置

server_name中支持通配符"*",但需要注意的是通配符不能出现在域名的中间,只能出现在首段或尾段,如:

server {
  listen 80;
  server_name  *.itcast.cn  www.itheima.*;
  # www.itcast.cn abc.itcast.cn www.itheima.cn www.itheima.com
  ...
}

下面的配置就会报错

server {
  listen 80;
  server_name  www.*.cn www.itheima.c*
  ...
}

配置三:使用正则表达式配置

server_name中可以使用正则表达式,并且使用~作为正则表达式字符串的开始标记。

常见的正则表达式

代码 说明
^ 匹配搜索字符串开始位置
$ 匹配搜索字符串结束位置
. 匹配除换行符\n之外的任何单个字符
\ 转义字符,将下一个字符标记为特殊字符
[xyz] 字符集,与任意一个指定字符匹配
[a-z] 字符范围,匹配指定范围内的任何字符
\w 与以下任意字符匹配 A-Z a-z 0-9 和下划线,等效于[A-Za-z0-9_]
\d 数字字符匹配,等效于[0-9]
正好匹配n次
至少匹配n次
匹配至少n次至多m次
* 零次或多次,等效于
+ 一次或多次,等效于
? 零次或一次,等效于

配置如下:

server{
        listen 80;
        server_name ~^www\.(\w+)\.com$;
        default_type text/plain;
        return 200 $1  $2 ..;
}
注意 ~后面不能加空格,括号可以取值

匹配执行顺序

由于server_name指令支持通配符和正则表达式,因此在包含多个虚拟主机的配置文件中,可能会出现一个名称被多个虚拟主机的server_name匹配成功,当遇到这种情况,当前的请求交给谁来处理呢?

server{
  listen 80;
  server_name ~^www\.\w+\.com$;
  default_type text/plain;
  return 200 'regex_success';
}

server{
  listen 80;
  server_name www.itheima.*;
  default_type text/plain;
  return 200 'wildcard_after_success';
}

server{
  listen 80;
  server_name *.itheima.com;
  default_type text/plain;
  return 200 'wildcard_before_success';
}

server{
  listen 80;
  server_name www.itheima.com;
  default_type text/plain;
  return 200 'exact_success';
}

server{
  listen 80 default_server;
  server_name _;
  default_type text/plain;
  return 444 'default_server not found server';
}

结论:

exact_success
wildcard_before_success
wildcard_after_success
regex_success
default_server not found server!!
No1:准确匹配server_name

No2:通配符在开始时匹配server_name成功

No3:通配符在结束时匹配server_name成功

No4:正则表达式匹配server_name成功

No5:被默认的default_server处理,如果没有指定默认找第一个server

2.1.1.3、location指令

server{
  listen 80;
  server_name localhost;
  location / {
  
  }
  location /abc{
  
  }
  ...
}

location:用来设置请求的URI

语法 location [ = | ~ | ~* | ^~ |@ ] uri
默认值
位置 server,location

uri变量是待匹配的请求字符串,可以不包含正则表达式,也可以包含正则表达式,那么nginx服务器在搜索匹配location的时候,是先使用不包含正则表达式进行匹配,找到一个匹配度最高的一个,然后在通过包含正则表达式的进行匹配,如果能匹配到直接访问,匹配不到,就使用刚才匹配度最高的那个location来处理请求。

属性介绍:

不带符号,要求必须以指定模式开始

server {
  listen 80;
  server_name 127.0.0.1;
  location /abc{
    default_type text/plain;
    return 200 "access success";
  }
}
以下访问都是正确的
http://192.168.200.133/abc
http://192.168.200.133/abc?p1=TOM
http://192.168.200.133/abc/
http://192.168.200.133/abcdef

= : 用于不包含正则表达式的uri前,必须与指定的模式精确匹配

server {
  listen 80;
  server_name 127.0.0.1;
  location =/abc{
    default_type text/plain;
    return 200 "access success";
  }
}
可以匹配到
http://192.168.200.133/abc
http://192.168.200.133/abc?p1=TOM
匹配不到
http://192.168.200.133/abc/
http://192.168.200.133/abcdef

~ : 用于表示当前uri中包含了正则表达式,并且区分大小写
~*: 用于表示当前uri中包含了正则表达式,并且不区分大小写

换句话说,如果uri包含了正则表达式,需要用上述两个符合来标识

server {
  listen 80;
  server_name 127.0.0.1;
  location ~^/abc\w${
    default_type text/plain;
    return 200 "access success";
  }
}
server {
  listen 80;
  server_name 127.0.0.1;
  location ~*^/abc\w${
    default_type text/plain;
    return 200 "access success";
  }
}

^~: 用于不包含正则表达式的uri前,功能和不加符号的一致,唯一不同的是,如果模式匹配,那么就停止搜索其他模式了。

server {
  listen 80;
  server_name 127.0.0.1;
  location ^~/abc{
    default_type text/plain;
    return 200 "access success";
  }
}
2.1.1.3.1、设置请求资源的目录root / alias

root:设置请求的根目录

语法 root path;
默认值 root html;
位置 http、server、location

path为Nginx服务器接收到请求以后查找资源的根目录路径。

alias:用来更改location的URI

语法 alias path;
默认值
位置 location

path为修改后的根路径。

以上两个指令都可以来指定访问资源的路径,那么这两者之间的区别是什么?

举例说明:

(1)在/usr/local/nginx/html目录下创建一个 images目录,并在目录下放入一张图片mv.png图片

location /images {
  root /usr/local/nginx/html;
}

访问图片的路径为:

http://192.168.200.133/images/mv.png

(2)如果把root改为alias

location /images {
  alias /usr/local/nginx/html;
}

再次访问上述地址,页面会出现404的错误,查看错误日志会发现是因为地址不对,所以验证了:

root的处理结果是: root路径+location路径
/usr/local/nginx/html/images/mv.png
alias的处理结果是:使用alias路径替换location路径
/usr/local/nginx/html/images

需要在alias后面路径改为

location /images {
  alias /usr/local/nginx/html/images;
}

(3)如果location路径是以/结尾,则alias也必须是以/结尾,root没有要求

将上述配置修改为

location /images/ {
  alias /usr/local/nginx/html/images;
}

访问就会出问题,查看错误日志还是路径不对,所以需要把alias后面加上 /

小结:

root的处理结果是: root路径+location路径
alias的处理结果是:使用alias路径替换location路径
alias是一个目录别名的定义,root则是最上层目录的含义。
如果location路径是以/结尾,则alias也必须是以/结尾,root没有要求
2.1.1.3.2、index指令

index:设置网站的默认首页

语法 index file ...;
默认值 index index.html;
位置 http、server、location

index后面可以跟多个设置,如果访问的时候没有指定具体访问的资源,则会依次进行查找,找到第一个为止。

举例说明:

location / {
  root /usr/local/nginx/html;
  index index.html index.htm;
}
访问该location的时候,可以通过 http://ip:port/,地址后面如果不添加任何内容,则默认依次访问index.html和index.htm,找到第一个来进行返回

2.1.1.4、error_page指令

error_page:设置网站的错误页面

语法 error_page code ... [=[response]] uri;
默认值
位置 http、server、location......

当出现对应的响应code后,如何来处理。

举例说明:

(1)可以指定具体跳转的地址

server {
  error_page 404 http://www.itcast.cn;
}

(2)可以指定重定向地址

server{
  error_page 404 /50x.html;
  error_page 500 502 503 504 /50x.html;
  location =/50x.html{
    root html;
  }
}

(3)使用location的@符合完成错误信息展示

server{
  error_page 404 @jump_to_error;
  location @jump_to_error {
    default_type text/plain;
    return 404 'Not Found Page...';
  }
}

可选项=[response]的作用是用来将相应代码更改为另外一个

server{
  error_page 404 =200 /50x.html;
  location =/50x.html{
    root html;
  }
}
这样的话,当返回404找不到对应的资源的时候,在浏览器上可以看到,最终返回的状态码是200,这块需要注意下,编写error_page后面的内容,404后面需要加空格,200前面不能加空格

2.1.2、静态资源优化配置语法

Nginx对静态资源如何进行优化配置。这里从三个属性配置进行优化:

sendfile on;
tcp_nopush on;
tcp_nodeplay on;

(1)sendfile,用来开启高效的文件传输模式。

语法 sendfile on |off;
默认值 sendfile off;
位置 http、server、location...

请求静态资源的过程:客户端通过网络接口向服务端发送请求,操作系统将这些客户端的请求传递给服务器端应用程序,服务器端应用程序会处理这些请求,请求处理完成以后,操作系统还需要将处理得到的结果通过网络适配器传递回去。

如:

server {
  listen 80;
  server_name localhost;
  location / {
    root html;
    index index.html;
  }
}
在html目录下有一个welcome.html页面,访问地址
http://192.168.200.133/welcome.html

1587655397104

1587665814562

(2)tcp_nopush:该指令必须在sendfile打开的状态下才会生效,主要是用来提升网络包的传输'效率'

语法 tcp_nopush on|off;
默认值 tcp_nopush off;
位置 http、server、location

(3)tcp_nodelay:该指令必须在keep-alive连接开启的情况下才生效,来提高网络包传输的'实时性'

语法 tcp_nodelay on|off;
默认值 tcp_nodelay on;
位置 http、server、location

1587832596733

经过刚才的分析,"tcp_nopush"和”tcp_nodelay“看起来是"互斥的",那么为什么要将这两个值都打开,这个大家需要知道的是在linux2.5.9以后的版本中两者是可以兼容的,三个指令都开启的好处是,sendfile可以开启高效的文件传输模式,tcp_nopush开启可以确保在发送到客户端之前数据包已经充分“填满”, 这大大减少了网络开销,并加快了文件发送的速度。 然后,当它到达最后一个可能因为没有“填满”而暂停的数据包时,Nginx会忽略tcp_nopush参数, 然后,tcp_nodelay强制套接字发送数据。由此可知,TCP_NOPUSH可以与TCP_NODELAY一起设置,它比单独配置TCP_NODELAY具有更强的性能。所以我们可以使用如下配置来优化Nginx静态资源的处理

sendfile on;
tcp_nopush on;
tcp_nodelay on;

2.2、Nginx静态资源压缩实战

在Nginx的配置文件中可以通过配置gzip来对静态资源进行压缩,相关的指令可以配置在http块、server块和location块中,Nginx可以通过

ngx_http_gzip_module模块
ngx_http_gzip_static_module模块
ngx_http_gunzip_module模块

对这些指令进行解析和处理。

接下来我们从以下内容进行学习

(1)Gzip各模块支持的配置指令
(2)Gzip压缩功能的配置
(3)Gzip和sendfile的冲突解决
(4)浏览器不支持Gzip的解决方案

2.2.1、Gzip模块配置指令

接下来所学习的指令都来自ngx_http_gzip_module模块,该模块会在nginx安装的时候内置到nginx的安装环境中,也就是说我们可以直接使用这些指令。

  1. gzip指令:该指令用于开启或者关闭gzip功能
语法 gzip on|off;
默认值 gzip off;
位置 http、server、location...

注意只有该指令为打开状态,下面的指令才有效果

http{
   gzip on;
}
  1. gzip_types指令:该指令可以根据响应页的MIME类型选择性地开启Gzip压缩功能
语法 gzip_types mime-type ...;
默认值 gzip_types text/html;
位置 http、server、location

所选择的值可以从mime.types文件中进行查找,也可以使用"*"代表所有。

http{
  gzip_types application/javascript;
}
  1. gzip_comp_level指令:该指令用于设置Gzip压缩程度,级别从1-9,1表示要是程度最低,要是效率最高,9刚好相反,压缩程度最高,但是效率最低最费时间。
语法 gzip_comp_level level;
默认值 gzip_comp_level 1;
位置 http、server、location
http{
  gzip_comp_level 6;
}
  1. gzip_vary指令:该指令用于设置使用Gzip进行压缩发送是否携带“Vary:Accept-Encoding”头域的响应头部。主要是告诉接收方,所发送的数据经过了Gzip压缩处理
语法 gzip_vary on|off;
默认值 gzip_vary off;
位置 http、server、location

1587361606028

  1. gzip_buffers指令:该指令用于处理请求压缩的缓冲区数量和大小。
语法 gzip_buffers number size;
默认值 gzip_buffers 32 4k|16 8k;
位置 http、server、location

其中number:指定Nginx服务器向系统申请缓存空间个数,size指的是每个缓存空间的大小。主要实现的是申请number个每个大小为size的内存空间。这个值的设定一般会和服务器的操作系统有关,所以建议此项不设置,使用默认值即可。

gzip_buffers 4 16K;   #缓存空间大小
  1. gzip_disable指令:针对不同种类客户端发起的请求,可以选择性地开启和关闭Gzip功能。
语法 gzip_disable regex ...;
默认值
位置 http、server、location

regex:根据客户端的浏览器标志(user-agent)来设置,支持使用正则表达式。指定的浏览器标志不使用Gzip.该指令一般是用来排除一些明显不支持Gzip的浏览器。

gzip_disable "MSIE [1-6]\.";
  1. gzip_http_version指令:针对不同的HTTP协议版本,可以选择性地开启和关闭Gzip功能。
语法 gzip_http_version 1.0|1.1;
默认值 gzip_http_version 1.1;
位置 http、server、location

该指令是指定使用Gzip的HTTP最低版本,该指令一般采用默认值即可。

  1. gzip_min_length指令:该指令针对传输数据的大小,可以选择性地开启和关闭Gzip功能
语法 gzip_min_length length;
默认值 gzip_min_length 20;
位置 http、server、location
nignx计量大小的单位:bytes[字节] / kb[千字节] / M[兆]
例如: 1024 / 10k|K / 10m|M

Gzip压缩功能对大数据的压缩效果明显,但是如果要压缩的数据比较小的化,可能出现越压缩数据量越大的情况,因此我们需要根据响应内容的大小来决定是否使用Gzip功能,响应页面的大小可以通过头信息中的Content-Length来获取。但是如何使用了Chunk编码动态压缩,该指令将被忽略。建议设置为1K或以上。

  1. gzip_proxied指令:该指令设置是否对服务端返回的结果进行Gzip压缩。
语法 gzip_proxied off|expired|no-cache|
no-store|private|no_last_modified|no_etag|auth|any;
默认值 gzip_proxied off;
位置 http、server、location

off - 关闭Nginx服务器对后台服务器返回结果的Gzip压缩
expired - 启用压缩,如果header头中包含 "Expires" 头信息
no-cache - 启用压缩,如果header头中包含 "Cache-Control:no-cache" 头信息
no-store - 启用压缩,如果header头中包含 "Cache-Control:no-store" 头信息
private - 启用压缩,如果header头中包含 "Cache-Control:private" 头信息
no_last_modified - 启用压缩,如果header头中不包含 "Last-Modified" 头信息
no_etag - 启用压缩 ,如果header头中不包含 "ETag" 头信息
auth - 启用压缩 , 如果header头中包含 "Authorization" 头信息
any - 无条件启用压缩

2.2.2、Gzip压缩功能的实例配置

gzip on;          #开启gzip功能
gzip_types *;     #压缩源文件类型,根据具体的访问资源类型设定
gzip_comp_level 6;    #gzip压缩级别
gzip_min_length 1024; #进行压缩响应页面的最小长度,content-length
gzip_buffers 4 16K;   #缓存空间大小
gzip_http_version 1.1; #指定压缩响应所需要的最低HTTP请求版本
gzip_vary  on;      #往头信息中添加压缩标识
gzip_disable "MSIE [1-6]\."; #对IE6以下的版本都不进行压缩
gzip_proxied  off; #nginx作为反向代理压缩服务端返回数据的条件

这些配置在很多地方可能都会用到,所以我们可以将这些内容抽取到一个配置文件中,然后通过include指令把配置文件再次加载到nginx.conf配置文件中,方法使用。

nginx_gzip.conf

gzip on;
gzip_types *;
gzip_comp_level 6;
gzip_min_length 1024;
gzip_buffers 4 16K;
gzip_http_version 1.1;
gzip_vary  on;
gzip_disable "MSIE [1-6]\.";
gzip_proxied  off;

nginx.conf

include nginx_gzip.conf

2.2.3、Gzip和sendfile共存问题

前面在讲解sendfile的时候,提到过,开启sendfile以后,在读取磁盘上的静态资源文件的时候,可以减少拷贝的次数,可以不经过用户进程将静态文件通过网络设备发送出去,但是Gzip要想对资源压缩,是需要经过用户进程进行操作的。所以如何解决两个设置的共存问题。

可以使用ngx_http_gzip_static_module模块的gzip_static指令来解决。

2.2.3.1、gzip_static指令

gzip_static: 检查与访问资源同名的.gz文件时,response中以gzip相关的header返回.gz文件的内容。

语法 gzip_static on | off | always;
默认值 gzip_static off;
位置 http、server、location

添加上述命令后,会报一个错误,unknown directive "gzip_static"主要的原因是Nginx默认是没有添加ngx_http_gzip_static_module模块。如何来添加?

2.2.3.2、添加模块到Nginx的实现步骤

(1)查询当前Nginx的配置参数

nginx -V

(2)将nginx安装目录下sbin目录中的nginx二进制文件进行更名

cd /usr/local/nginx/sbin
mv nginx nginxold

(3) 进入Nginx的安装目录

cd /root/nginx/core/nginx-1.16.1

(4)执行make clean清空之前编译的内容

make clean

(5)使用configure来配置参数

./configure --with-http_gzip_static_module

(6)使用make命令进行编译

make

(7) 将objs目录下的nginx二进制执行文件移动到nginx安装目录下的sbin目录中

mv objs/nginx /usr/local/nginx/sbin

(8)执行更新命令

make upgrade

2.2.3.3、gzip_static测试使用

(1)直接访问http://192.168.200.133/jquery.js

1587932106429

(2)使用gzip命令进行压缩

cd /usr/local/nginx/html
gzip jquery.js

(3)再次访问http://192.168.200.133/jquery.js

1587932300006

2.3、静态资源的缓存处理

2.3.1、浏览器缓存

是为了节约网络的资源加速浏览,浏览器在用户磁盘上对最近请求过的文档进行存储,当访问者再次请求这个页面时,浏览器就可以从本地磁盘显示文档,这样就可以加速页面的阅览.

2.3.2、为什么要用浏览器缓存

成本最低的一种缓存实现
减少网络带宽消耗
降低服务器压力
减少网络延迟,加快页面打开速度

2.3.3、浏览器缓存的执行流程

HTTP协议中和页面缓存相关的字段,我们先来认识下:

header 说明
Expires 缓存过期的日期和时间
Cache-Control 设置和缓存相关的配置信息
Last-Modified 请求资源最后修改时间
ETag 请求变量的实体标签的当前值,比如文件的MD5值

2.3.4、请求流程

(1)用户首次通过浏览器发送请求到服务端获取数据,客户端是没有对应的缓存,所以需要发送request请求来获取数据;
(2)服务端接收到请求后,获取服务端的数据及服务端缓存的允许后,返回200的成功状态码并且在响应头上附上对应资源以及缓存信息;
(3)当用户再次访问相同资源的时候,客户端会在浏览器的缓存目录中查找是否存在响应的缓存文件
(4)如果没有找到对应的缓存文件,则走(2)步
(5)如果有缓存文件,接下来对缓存文件是否过期进行判断,过期的判断标准是(Expires),
(6)如果没有过期,则直接从本地缓存中返回数据进行展示
(7)如果Expires过期,接下来需要判断缓存文件是否发生过变化
(8)判断的标准有两个,一个是ETag(Entity Tag),一个是Last-Modified
(9)判断结果是未发生变化,则服务端返回304,直接从缓存文件中获取数据
(10)如果判断是发生了变化,重新从服务端获取数据,并根据缓存协商(服务端所设置的是否需要进行缓存数据的设置)来进行数据缓存。

2.3.5、浏览器缓存相关指令

Nginx需要进行缓存相关设置,就需要用到如下的指令

2.3.6、expires指令

expires:该指令用来控制页面缓存的作用。可以通过该指令控制HTTP应答中的“Expires"和”Cache-Control"

语法 expires [modified] time
expires epoch|max|off;
默认值 expires off;
位置 http、server、location

time:可以整数也可以是负数,指定过期时间,如果是负数,Cache-Control则为no-cache,如果为整数或0,则Cache-Control的值为max-age=time;

epoch: 指定Expires的值为'1 January,1970,00:00:01 GMT'(1970-01-01 00:00:00),Cache-Control的值no-cache

max:指定Expires的值为'31 December2037 23:59:59GMT' (2037-12-31 23:59:59) ,Cache-Control的值为10年

off:默认不缓存。

2.3.7、add_header指令

add_header指令是用来添加指定的响应头和响应值。

语法 add_header name value [always];
默认值
位置 http、server、location...

Cache-Control作为响应头信息,可以设置如下值:

缓存响应指令:

Cache-control: must-revalidate
Cache-control: no-cache
Cache-control: no-store
Cache-control: no-transform
Cache-control: public
Cache-control: private
Cache-control: proxy-revalidate
Cache-Control: max-age=<seconds>
Cache-control: s-maxage=<seconds>
指令 说明
must-revalidate 可缓存但必须再向源服务器进行确认
no-cache 缓存前必须确认其有效性
no-store 不缓存请求或响应的任何内容
no-transform 代理不可更改媒体类型
public 可向任意方提供响应的缓存
private 仅向特定用户返回响应
proxy-revalidate 要求中间缓存服务器对缓存的响应有效性再进行确认
max-age=<秒> 响应最大Age值
s-maxage=<秒> 公共缓存服务器响应的最大Age值

max-age=[秒]:

2.4、Nginx的跨域问题

2.4.1、同源策略

浏览器的同源策略:是一种约定,是浏览器最核心也是最基本的安全功能,如果浏览器少了同源策略(协议、域名(IP)、端口相同),则浏览器的正常功能可能都会受到影响。
如有两台服务器分别为α、β,如果从服务器α的页面发送异步请求到服务器β获取数据,如果服务器α和服务器β不满足同源策略,则就会出现跨域问题。

2.4.2、解决方案

使用add_header指令,该指令可以用来添加一些头信息

语法 add_header name value...
默认值
位置 http、server、location

此处用来解决跨域问题,需要添加两个头信息,一个是Access-Control-Allow-Origin,Access-Control-Allow-Methods

Access-Control-Allow-Origin: 直译过来是允许跨域访问的源地址信息,可以配置多个(多个用逗号分隔),也可以使用*代表所有源

Access-Control-Allow-Methods:直译过来是允许跨域访问的请求方式,值可以为 GET POST PUT DELETE...,可以全部设置,也可以根据需要设置,多个用逗号分隔

具体配置方式

location /getUser{
    add_header Access-Control-Allow-Origin *;
    add_header Access-Control-Allow-Methods GET,POST,PUT,DELETE;
    default_type application/json;
    return 200 '{"id":1,"name":"TOM","age":18}';
}

3、Rewrite功能配置

Rewrite是Nginx服务器提供的一个重要基本功能,是Web服务器产品中几乎必备的功能。主要的作用是用来实现URL的重写。

Rewrite的相关命令

  • set指令
  • if指令
  • break指令
  • return指令
  • rewrite指令
  • rewrite_log指令

Rewrite的应用场景

  • 域名跳转
  • 域名镜像
  • 独立域名
  • 目录自动添加"/"
  • 合并目录
  • 防盗链的实现

3.1、Rewrite的相关指令

3.1.1、set指令

该指令用来设置一个新的变量。

语法 set $variable value;
默认值
位置 server、location、if

variable:变量的名称,该变量名称要用"$"作为变量的第一个字符,且不要与Nginx服务器预设的全局变量同名。

value:变量的值,可以是字符串、其他变量或者变量的组合等。

3.1.2、Rewrite常用全局变量

示例:

curl -L -X POST 'http://127.0.0.1/goods?id=9&num=5'
变量 说明
$args 变量中存放了请求URL中的请求参数。示例中取值为 id=9&num=5
$query_string 变量中存放了请求URL中的请求参数。示例中取值为 id=9&num=5
$http_user_agent 变量存储的是用户访问服务的代理信息(如果通过浏览器访问,记录的是浏览器的相关版本信息)
$host 变量存储的是访问服务器的server_name值。实例中取值为 127.0.0.1
$uri 变量存储的是当前访问地址的URI。示例中取值为/goods
$document_uri 变量存储的是当前访问地址的URI。示例中取值为/goods
$document_root 变量存储的是当前请求对应location的root值,如果未设置,默认指向Nginx自带html目录所在位置
$content_length 变量存储的是请求头中的Content-Length的值
$content_type 变量存储的是请求头中的Content-Type的值
$http_cookie 变量存储的是客户端的cookie信息,可以通过add_header Set-Cookie 'cookieName=cookieValue'来添加cookie数据
$limit_rate 变量中存储的是Nginx服务器对网络连接速率的限制,也就是Nginx配置中对limit_rate指令设置的值,默认是0,不限制。
$remote_addr 变量中存储的是客户端的IP地址
$remote_port 变量中存储了客户端与服务端建立连接的端口号
$remote_user 变量中存储了客户端的用户名,需要有认证模块才能获取
$scheme 变量中存储了访问协议
$server_addr 变量中存储了服务端的地址
$server_name 变量中存储了客户端请求到达的服务器的名称
$server_port 变量中存储了客户端请求到达服务器的端口号
$server_protocol 变量中存储了客户端请求协议的版本,比如"HTTP/1.1"
$request_body_file 变量中存储了发给后端服务器的本地文件资源的名称
$request_method 变量中存储了客户端的请求方式,比如"GET","POST"等。实例中取值为 POST
$request_filename 变量中存储了当前请求的资源文件的路径名
$request_uri 变量中存储了当前请求的URI,并且携带请求参数。示例中取值为 /goods?id=9&num=5

3.1.3、if指令

该指令用来支持条件判断,并根据条件判断结果选择不同的Nginx配置。

语法 if (condition)
默认值
位置 server、location

condition为判定条件,可以支持以下写法:

1. 变量名。如果变量名对应的值为空字符串或"0",if都判断为false,其他条件为true。

```plain
if ($param){

}
```

2. 使用"="和"!="比较变量和字符串是否相等,满足条件为true,不满足为false

```plain
if ($request_method = POST){
    return 405;
}
```

注意:此处和Java不太一样的地方是字符串不需要添加引号,并且等号和不等号前后到需要加空格。

3. 使用正则表达式对变量进行匹配,匹配成功返回true,否则返回false。变量与正则表达式之间使用"~","~*","!~","!~\*"来连接。

   "~"代表匹配正则表达式过程中区分大小写,

   "~\*"代表匹配正则表达式过程中不区分大小写

   "!~"和"!~\*"刚好和上面取相反值,如果匹配上返回false,匹配不上返回true

```plain
if ($http_user_agent ~ MSIE){
    #$http_user_agent的值中是否包含MSIE字符串,如果包含返回true
}
```

注意:正则表达式字符串一般不需要加引号,但是如果字符串中包含"}"或者是";"等字符时,就需要把引号加上。

4. 判断请求的文件是否存在使用"-f"和"!-f",
```plain
if (-f $request_filename){
    #判断请求的文件是否存在
}
if (!-f $request_filename){
    #判断请求的文件是否不存在
}
```

5. 判断请求的目录是否存在使用"-d"和"!-d"

6. 判断请求的目录或者文件是否存在使用"-e"和"!-e"

7. 判断请求的文件是否可执行使用"-x"和"!-x"

3.1.4、break指令

该指令用于中断当前相同作用域中的其他Nginx配置。与该指令处于同一作用域的Nginx配置中,位于它前面的指令配置生效,位于后面的指令配置无效。并且break还有另外一个功能就是终止当前的匹配并把当前的URI在本location进行重定向访问处理。

语法 break;
默认值
位置 server、location、if

例子:

location /testbreak{
  default_type text/plain;
  set $username TOM;
  if ($args){
    Set $username JERRY;
        break;
    set $username ROSE;
  }
  add_header username $username;
  return 200 $username;
}

3.1.5、return指令

该指令用于完成对请求的处理,直接向客户端返回。在return后的所有Nginx配置都是无效的。

语法 return code [text];
return code URL;
return URL;
默认值
位置 server、location、if

code:为返回给客户端的HTTP状态代理。可以返回的状态代码为0~999的任意HTTP状态代理

text:为返回给客户端的响应体内容,支持变量的使用

URL:为返回给客户端的URL地址

location /testreturn {

  return 200 success;
}

location /testreturn {

  return https://www.baidu.com; // 302重定向到百度
}

location /testreturn {
  return 302 https://www.baidu.com;
}

location /testreturn {
  return 302 www.baidu.com;//不允许这么写
}

3.1.6、rewrite指令

该指令通过正则表达式的使用来改变URI。可以同时存在一个或者多个指令,按照顺序依次对URL进行匹配和处理。

语法 rewrite regex replacement [flag];
默认值
位置 server、location、if

regex:用来匹配URI的正则表达式

replacement:匹配成功后,用于替换URI中被截取内容的字符串。如果该字符串是以"http://"或者"https://"开头的,则不会继续向下对URI进行其他处理,而是直接返回重写后的URI给客户端。

location rewrite {
  rewrite ^/rewrite/url\w*$ https://www.baidu.com;
  rewrite ^/rewrite/(test)\w*$ /$1;
  rewrite ^/rewrite/(demo)\w*$ /$1;
}
location /test{
  default_type text/plain;
  return 200 test_success;
}
location /demo{
  default_type text/plain;
  return 200 demo_success;
}

flag:用来设置rewrite对URI的处理行为,可选值有如下:

  • last:终止继续在本location块中处理接收到的URI,并将此处重写的URI作为一个新的URI,使用各location块进行处理。该标志将重写后的URI重写在server块中执行,为重写后的URI提供了转入到其他location块的机会。
location rewrite {
  rewrite ^/rewrite/(test)\w*$ /$1 last;
  rewrite ^/rewrite/(demo)\w*$ /$1 last;
}
location /test{
  default_type text/plain;
  return 200 test_success;
}
location /demo{
  default_type text/plain;
  return 200 demo_success;
}

访问 http://192.168.200.133:8081/rewrite/testabc,能正确访问

1589475653252

  • break:将此处重写的URI作为一个新的URI,在本块中继续进行处理。该标志将重写后的地址在当前的location块中执行,不会将新的URI转向其他的location块。
location rewrite {
    #/test   /usr/local/nginx/html/test/index.html
  rewrite ^/rewrite/(test)\w*$ /$1 break;
  rewrite ^/rewrite/(demo)\w*$ /$1 break;
}
location /test{
  default_type text/plain;
  return 200 test_success;
}
location /demo{
  default_type text/plain;
  return 200 demo_success;
}

访问 http://192.168.200.133:8081/rewrite/demoabc,页面报404错误

1589475732042

  • redirect:将重写后的URI返回给客户端,状态码为302,指明是临时重定向URI,主要用在replacement变量不是以"http://"或者"https://"开头的情况。
location rewrite {
  rewrite ^/rewrite/(test)\w*$ /$1 redirect;
  rewrite ^/rewrite/(demo)\w*$ /$1 redirect;
}
location /test{
  default_type text/plain;
  return 200 test_success;
}
location /demo{
  default_type text/plain;
  return 200 demo_success;
}

访问http://192.168.200.133:8081/rewrite/testabc请求会被临时重定向,浏览器地址也会发生改变

  • permanent:将重写后的URI返回给客户端,状态码为301,指明是永久重定向URI,主要用在replacement变量不是以"http://"或者"https://"开头的情况。
location rewrite {
  rewrite ^/rewrite/(test)\w*$ /$1 permanent;
  rewrite ^/rewrite/(demo)\w*$ /$1 permanent;
}
location /test{
  default_type text/plain;
  return 200 test_success;
}
location /demo{
  default_type text/plain;
  return 200 demo_success;
}

访问http://192.168.200.133:8081/rewrite/testabc请求会被永久重定向,浏览器地址也会发生改变

3.1.7、rewrite_log指令

该指令配置是否开启URL重写日志的输出功能。

语法 rewrite_log on|off;
默认值 rewrite_log off;
位置 http、server、location、if

开启后,URL重写的相关日志将以notice级别输出到error_log指令配置的日志文件汇总。

rewrite_log on;
error_log  logs/error.log notice;

3.2、Rewrite的案例

3.2.1、域名跳转

》问题分析

先来看一个效果,如果我们想访问京东网站,大家都知道我们可以输入www.jd.com,但是同样的我们也可以输入www.360buy.com同样也都能访问到京东网站。这个其实是因为京东刚开始的时候域名就是www.360buy.com,后面由于各种原因把自己的域名换成了www.jd.com, 虽然说域名变量,但是对于以前只记住了www.360buy.com的用户来说,我们如何把这部分用户也迁移到我们新域名的访问上来,针对于这个问题,我们就可以使用Nginx中Rewrite的域名跳转来解决。

》环境准备

  • 准备三个域名:
vim /etc/hosts
127.0.0.1   www.itcast.cn
127.0.0.1   www.itheima.cn
127.0.0.1   www.itheima.com
  • 通过Nginx实现访问www.itcast.cn
server {
  listen 80;
  server_name www.itcast.cn;
  location /{
    default_type text/html;
    return 200 '<h1>welcome to itcast</h1>';
  }
}

》通过Rewrite完成将www.ithema.com和www.itheima.cn的请求跳转到www.itcast.com

server {
  listen 80;
  server_name www.itheima.com www.itheima.cn;
  rewrite ^/ http://www.itcast.cn;
}

问题描述:如何在域名跳转的过程中携带请求的URI?

修改配置信息

server {
  listen 80;
  server_name www.itheima.com www.itheima.cn;
  rewrite ^(.*) http://www.itcast.cn$1;
}

3.2.2、域名镜像

镜像网站指定是将一个完全相同的网站分别放置到几台服务器上,并分别使用独立的URL进行访问。其中一台服务器上的网站叫主站,其他的为镜像网站。镜像网站和主站没有太大的区别,可以把镜像网站理解为主站的一个备份节点。可以通过镜像网站提供网站在不同地区的响应速度。镜像网站可以平衡网站的流量负载、可以解决网络宽带限制、封锁等。

1589560433192

而我们所说的域名镜像和网站镜像比较类似,上述案例中,将www.itheima.com和 www.itheima.cn都能跳转到www.itcast.cn,那么www.itcast.cn我们就可以把它起名叫主域名,其他两个就是我们所说的镜像域名,当然如果我们不想把整个网站做镜像,只想为其中某一个子目录下的资源做镜像,我们可以在location块中配置rewrite功能,比如:

server {
    listen          80;
    server_name     www.itheima.cn www.itheima.com;
    location /user {
      rewrite ^/user(.*)$ http://www.itcast.cn$1;
    }
    location /emp{
        default_type text/html;
        return 200 '<h1>emp_success</h1>';
    }
}

3.2.3、独立域名

一个完整的项目包含多个模块,比如购物网站有商品搜索模块、商品详情模块和购物车模块等,那么我们如何为每一个模块设置独立的域名。

需求:

http://search.itcast.com:81  访问商品搜索模块
http://item.itcast.com:82   访问商品详情模块
http://cart.itcast.com:83   访问商品购物车模块
server{
  listen 81;
  server_name search.itcast.com;
  rewrite ^(.*) http://www.itcast.cn/search$1;
}
server{
  listen 82;
  server_name item.itcast.com;
  rewrite ^(.*) http://www.itcast.cn/item$1;
}
server{
  listen 83;
  server_name cart.itcast.com;
  rewrite ^(.*) http://www.itcast.cn/cart$1;
}

3.2.4、目录自动添加"/"

问题描述

通过一个例子来演示下问题:

server {
  listen  8082;
  server_name localhost;
  location /heima {
    root html;
    index index.html;
  }
}

通过http://192.168.200.133:8082/heima和通过http://192.168.200.133:8082/heima/访问的区别?

如果不加斜杠,Nginx服务器内部会自动做一个301的重定向,重定向的地址会有一个指令叫server_name_in_redirect on|off;来决定重定向的地址:

如果该指令为on
  重定向的地址为:  http://server_name:8082/目录名/;
  http://localhost:8082/heima/
如果该指令为off
  重定向的地址为:  http://原URL中的域名:8082/目录名/;
  http://192.168.200.133:8082/heima/

所以就拿刚才的地址来说,http://192.168.200.133:8082/heima如果不加斜杠,那么按照上述规则,如果指令server_name_in_redirect为on,则301重定向地址变为 http://localhost:8082/heima/,如果为off,则301重定向地址变为http://192.168.200.133:8082/heima/。后面这个是正常的,前面地址就有问题。

注意server_name_in_redirect指令在Nginx的0.8.48版本之前默认都是on,之后改成了off,所以现在我们这个版本不需要考虑这个问题,但是如果是0.8.48以前的版本并且server_name_in_redirect设置为on,我们如何通过rewrite来解决这个问题?

解决方案

我们可以使用rewrite功能为末尾没有斜杠的URL自动添加一个斜杠

server {
  listen  80;
  server_name localhost;
  server_name_in_redirect on;
  location /heima {
    if (-d $request_filename){
      rewrite ^/(.*)([^/])$ http://$host/$1$2/ permanent;
    }
  }
}

3.2.5、合并目录

搜索引擎优化(SEO)是一种利用搜索引擎的搜索规则来提高目的网站在有关搜索引擎内排名的方式。我们在创建自己的站点时,可以通过很多中方式来有效的提供搜索引擎优化的程度。其中有一项就包含URL的目录层级一般不要超过三层,否则的话不利于搜索引擎的搜索也给客户端的输入带来了负担,但是将所有的文件放在一个目录下又会导致文件资源管理混乱并且访问文件的速度也会随着文件增多而慢下来,这两个问题是相互矛盾的,那么使用rewrite如何解决上述问题?

举例,网站中有一个资源文件的访问路径时 /server/11/22/33/44/20.html,也就是说20.html存在于第5级目录下,如果想要访问该资源文件,客户端的URL地址就要写成 http://192.168.200.133/server/11/22/33/44/20.html,

server {
  listen 8083;
  server_name localhost;
  location /server{
    root html;
  }
}

但是这个是非常不利于SEO搜索引擎优化的,同时客户端也不好记.使用rewrite我们可以进行如下配置:

server {
  listen 8083;
  server_name localhost;
  location /server{
    rewrite ^/server-([0-9]+)-([0-9]+)-([0-9]+)-([0-9]+)\.html$ /server/$1/$2/$3/$4/$5.html last;
  }
}

这样的花,客户端只需要输入http://www.web.name/server-11-22-33-44-20.html就可以访问到20.html页面了。这里也充分利用了rewrite指令支持正则表达式的特性。

3.2.6、防盗链

防盗链之前我们已经介绍过了相关的知识,在rewrite中的防盗链和之前将的原理其实都是一样的,只不过通过rewrite可以将防盗链的功能进行完善下,当出现防盗链的情况,我们可以使用rewrite将请求转发到自定义的一张图片和页面,给用户比较好的提示信息。下面我们就通过根据文件类型实现防盗链的一个配置实例:

location /images {
    root html;
    valid_referers none blocked www.baidu.com;
    if ($invalid_referer){
        #return 403;
        rewrite ^/    /images/forbidden.png break;
    }
}

4、反向代理

Nginx反向代理模块的指令是由ngx_http_proxy_module模块进行解析,该模块在安装Nginx的时候已经自己加装到Nginx中了,接下来我们把反向代理中的常用指令一一介绍下:

proxy_pass
proxy_set_header
proxy_redirect

4.1、proxy_pass

该指令用来设置被代理服务器地址,可以是主机名称、IP地址加端口号形式。

语法 proxy_pass URL;
默认值
位置 location

URL:为要设置的被代理服务器地址,包含传输协议(http,https://)、主机名称或IP地址加端口号、URI等要素。

4.2、proxy_set_header

该指令可以更改Nginx服务器接收到的客户端请求的请求头信息,然后将新的请求头发送给代理的服务器

语法 proxy_set_header field value;
默认值 proxy_set_header Host $proxy_host;
proxy_set_header Connection close;
位置 http、server、location

需要注意的是,如果想要看到结果,必须在被代理的服务器上来获取添加的头信息。

被代理服务器: [192.168.200.146]

server {
        listen  8080;
        server_name localhost;
        default_type text/plain;
        return 200 $http_username;
}

代理服务器: [192.168.200.133]

server {
    listen  8080;
    server_name localhost;

    location /server {
        proxy_pass http://192.168.200.146:8080/;
        proxy_set_header username TOM;
    }
}

访问测试

4.3、proxy_redirect

该指令是用来重置头信息中的"Location"和"Refresh"的值。

语法 proxy_redirect redirect replacement;
proxy_redirect default;
proxy_redirect off;
默认值 proxy_redirect default;
位置 http、server、location

》为什么要用该指令?

服务端[192.168.200.146]

server {
    listen  8081;
    server_name localhost;
    if (!-f $request_filename){
      return 302 http://192.168.200.146;
    }
}

代理服务端[192.168.200.133]

server {
  listen  8081;
  server_name localhost;
  location / {
    proxy_pass http://192.168.200.146:8081/;
    proxy_redirect http://192.168.200.146 http://192.168.200.133;
  }
}

》该指令的几组选项

proxy_redirect redirect replacement;

redirect:目标,Location的值
replacement:要替换的值

proxy_redirect default;

default;
将location块的uri变量作为replacement,
将proxy_pass变量作为redirect进行替换

proxy_redirect off;

关闭proxy_redirect的功能

5、负载均衡

5.1、七层负载均衡

5.1.1、说明

Nginx要实现七层负载均衡需要用到proxy_pass代理模块配置。Nginx默认安装支持这个模块,我们不需要再做任何处理。Nginx的负载均衡是在Nginx的反向代理基础上把用户的请求根据指定的算法分发到一组【upstream虚拟服务池】。

5.1.2、要用到的指令

5.1.2.1、upstream指令

该指令用来指定后端服务器的名称和一些参数,可以使用域名、IP、端口或者unix socket。

语法 upstream name
默认值
位置 http

5.1.2.2、server指令

该指令是用来定义一组服务器,它们可以是监听不同端口的服务器,并且也可以是同时监听TCP和Unix socket的服务器。服务器可以指定不同的权重,默认为1。

语法 server name [paramerters]
默认值
位置 upstream

5.1.3、实现流程

图。

5.1.4、配置示例

配置成功后,访问 http://127.0.0.1 请求会一次访问三个服务。

5.1.4.1、服务一

server {
    listen       8081;
    server_name  127.0.0.1;

    location / {
        default_type text/plain;
        return 200 "127.0.0.1 <=> 8081";
    }
}

5.1.4.2、服务二

server {
    listen       8082;
    server_name  127.0.0.1;

    location / {
        default_type text/plain;
        return 200 "127.0.0.1 <=> 8082";
    }
}

5.1.4.3、服务三

server {
    listen       8083;
    server_name  127.0.0.1;

    location / {
        default_type text/plain;
        return 200 "127.0.0.1 <=> 8083";
    }
}

5.1.4.4、均衡配置

upstream backend {
    server 127.0.0.1:8081;
    server 127.0.0.1:8082;
    server 127.0.0.1:8083;
}

server {
    listen       80;
    server_name  127.0.0.1;

    location / {
        proxy_pass http://backend;
    }
}

5.1.5、负载均衡状态

代理服务器在负责均衡调度中的状态有以下几个

状态 概述
down 当前的server暂时不参与负载均衡
backup 预留的备份服务器
max_fails 允许请求失败的次数
fail_timeout 经过max_fails失败后, 服务暂停时间
max_conns 限制最大的接收连接数
5.1.5.1、down

将该服务器标记为永久不可用,那么该代理服务器将不参与负载均衡。该状态一般会对需要停机维护的服务器进行设置。

upstream backend{
  server 192.168.200.146:9001 down;
  server 192.168.200.146:9002;
  server 192.168.200.146:9003;
}

server {
  listen 8083;
  server_name localhost;

  location /{
    proxy_pass http://backend;
  }
}
5.1.5.2、backup

将该服务器标记为备份服务器,当主服务器不可用时,将用来传递请求。

upstream backend{
  server 192.168.200.146:9001 down;
  server 192.168.200.146:9002 backup;
  server 192.168.200.146:9003;
}

server {
  listen 8083;
  server_name localhost;

  location / {
    proxy_pass  http://backend;
  }
}
5.1.5.3、max_conns

max_conns=number:用来设置代理服务器同时活动链接的最大数量,默认为0,表示不限制,使用该配置可以根据后端服务器处理请求的并发量来进行设置,防止后端服务器被压垮。

5.1.5.4、max_failsfail_timeout

max_fails=number:设置允许请求代理服务器失败的次数,默认为1。
fail_timeout=time:设置经过max_fails失败后,服务暂停的时间,默认是10秒。

upstream backend{
  server 192.168.200.133:9001 down;
  server 192.168.200.133:9002 backup;
  server 192.168.200.133:9003 max_fails=3 fail_timeout=15;
}

server {
  listen 8083;
  server_name localhost;

  location / {
    proxy_pass  http://backend;
  }
}

5.1.6、 负载均衡策略

Nginx的upstream支持如下六种方式的分配算法,分别是:

算法名称 说明
轮询 默认方式
weight 权重方式
ip_hash 依据IP分配方式
least_conn 依据最少连接方式
url_hash 依据URL分配方式
fair 依据响应时间方式

5.1.6.1、 轮询

轮询是upstream模块负载均衡默认的策略。每个请求会按时间顺序逐个分配到不同的后端服务器。轮询不需要额外的配置。

upstream backend{
  server 192.168.200.146:9001 weight=1;
  server 192.168.200.146:9002;
  server 192.168.200.146:9003;
}

server {
  listen 8083;
  server_name localhost;

  location /{
    proxy_pass http://backend;
  }
}

5.1.6.2、 weight加权[加权轮询]

weight=number:用来设置服务器的权重,默认为1,权重数据越大,被分配到请求的几率越大;该权重值,主要是针对实际工作环境中不同的后端服务器硬件配置进行调整的,所有此策略比较适合服务器的硬件配置差别比较大的情况。

upstream backend{
  server 192.168.200.146:9001 weight=10;
  server 192.168.200.146:9002 weight=5;
  server 192.168.200.146:9003 weight=3;
}

server {
  listen 8083;
  server_name localhost;

  location / {
    proxy_pass http://backend;
  }
}

5.1.6.3、 ip_hash

当对后端的多台动态应用服务器做负载均衡时,ip_hash指令能够将某个客户端IP的请求通过哈希算法定位到同一台后端服务器上。这样,当来自某一个IP的用户在后端Web服务器A上登录后,在访问该站点的其他URL,能保证其访问的还是后端web服务器A。使用ip_hash指令无法保证后端服务器的负载均衡,可能导致有些后端服务器接收到的请求多,有些后端服务器接收的请求少,而且设置后端服务器权重等方法将不起作用。

语法 ip_hash;
默认值
位置 upstream
upstream backend{
  ip_hash;
  server 192.168.200.146:9001;
  server 192.168.200.146:9002;
  server 192.168.200.146:9003;
}

server {
  listen 8083;
  server_name localhost;

  location / {
    proxy_pass http://backend;
  }
}

5.1.6.4、 least_conn

最少连接,把请求转发给连接数较少的后端服务器。轮询算法是把请求平均的转发给各个后端,使它们的负载大致相同;但是,有些请求占用的时间很长,会导致其所在的后端负载较高。这种情况下,least_conn这种方式就可以达到更好的负载均衡效果。
此策略适合请求处理时间长短不一造成服务器过载的情况。

upstream backend{
  least_conn;
  server 192.168.200.146:9001;
  server 192.168.200.146:9002;
  server 192.168.200.146:9003;
}

server {
  listen 8083;
  server_name localhost;

  location / {
    proxy_pass http://backend;
  }
}

5.1.6.5、 url_hash

按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,要配合缓存命中来使用。同一个资源多次请求,可能会到达不同的服务器上,导致不必要的多次下载,缓存命中率不高,以及一些资源时间的浪费。而使用url_hash,可以使得同一个url(也就是同一个资源请求)会到达同一台服务器,一旦缓存住了资源,再此收到请求,就可以从缓存中读取。

upstream backend{
  hash &request_uri;
  server 192.168.200.146:9001;
  server 192.168.200.146:9002;
  server 192.168.200.146:9003;
}
server {
  listen 8083;
  server_name localhost;
  location /{
    proxy_pass http://backend;
  }
}

5.1.6.5、 fair

fair采用的不是内建负载均衡使用的轮换的均衡算法,而是可以根据页面大小、加载时间长短智能的进行负载均衡。那么如何使用第三方模块的fair负载均衡策略。

upstream backend{
  fair;
  server 192.168.200.146:9001;
  server 192.168.200.146:9002;
  server 192.168.200.146:9003;
}

server {
  listen 8083;
  server_name localhost;

  location / {
    proxy_pass http://backend;
  }
}

但是如何直接使用会报错,因为fair属于第三方模块实现的负载均衡。需要添加nginx-upstream-fair,如何添加对应的模块:

5.1.6.5.1、下载nginx-upstream-fair模块
下载地址为:
  https://github.com/gnosek/nginx-upstream-fair
5.1.6.5.2、将下载的文件上传到服务器并进行解压缩
unzip nginx-upstream-fair-master.zip
5.1.6.5.3、重命名资源
mv nginx-upstream-fair-master fair
5.1.6.5.4、使用./configure命令将资源添加到Nginx模块中
./configure --add-module=/root/fair
5.1.6.5.5、编译
make

编译可能会出现如下错误,ngx_http_upstream_srv_conf_t结构中缺少default_port。可以在Nginx的源码中 src/http/ngx_http_upstream.h,找到ngx_http_upstream_srv_conf_s,在模块中添加添加default_port属性

int_por_t    port;
in_port_t    default_port;
ngx_unit_t   no_port;

然后再进行make.

5.1.6.5.6、更新Nginx
5.1.6.5.6.1、将sbin目录下的nginx进行备份
mv /usr/local/nginx/sbin/nginx /usr/local/nginx/sbin/nginxold
5.1.6.5.6.2、将安装目录下的objs中的nginx拷贝到sbin目录
cp objs/nginx /usr/local/nginx/sbin
5.1.6.5.6.3、更新Nginx
make upgrade

5.2、四层负载均衡

四层负载均衡数据包是在底层就进行了分发,而七层负载均衡数据包则在最顶端进行分发,所以四层负载均衡的效率比七层负载均衡的要高。四层负载均衡不识别域名,而七层负载均衡识别域名。
Nginx在1.9之后,增加了一个stream模块,用来实现四层协议的转发、代理、负载均衡等。stream模块的用法跟http的用法类似,允许我们配置一组TCP或者UDP等协议的监听,然后通过proxy_pass来转发我们的请求,通过upstream添加多个后端服务,实现负载均衡。
四层协议负载均衡的实现,一般都会用到LVS、HAProxy、F5等,要么很贵要么配置很麻烦,而Nginx的配置相对来说更简单,更能快速完成工作。

5.2.1、添加stream模块的支持

Nginx默认是没有编译这个模块的,需要使用到stream模块,那么需要在编译的时候加上--with-stream
完成添加--with-stream的实现步骤如下:

  • 将原有/usr/local/nginx/sbin/nginx进行备份
  • 拷贝nginx之前的配置信息
  • 在nginx的安装源码进行配置指定对应模块 ./configure --with-stream
  • 通过make模板进行编译
  • 将objs下面的nginx移动到/usr/local/nginx/sbin下
  • 在源码目录下执行 make upgrade进行升级,这个可以实现不停机添加新模块的功能

5.2.2、配置示例

stream {
  upstream redisbackend {
    server 192.168.200.146:6379;
    server 192.168.200.146:6378;
  }

  upstream tomcatbackend {
      server 192.168.200.146:8080;
      server 192.168.200.146:8081;
  }

  server {
    listen  81;
    proxy_pass redisbackend;
  }

  server {
    listen  82;
    proxy_pass  tomcatbackend;
  }
}

6、缓存集成

编辑中。

7、Tomcat集群

7.1、网络配置

IP PORT DESC
10.108.10.100 80 Nginx Web Server
10.108.10.101 8080 Tomcat App Server①
10.108.10.102 8080 Tomcat App Server②
10.108.10.103 8080 Tomcat App Server③

7.2、Web Server配置

# 负载均衡配置
upstream server-api {
  server 10.108.10.101:8080;
  server 10.108.10.102:8080;
  server 10.108.10.103:8080;
}

server {
  listen  80;
  server_name  localhost;

  # 静态资源配置
  location / {
    root  /www/wwwroot/projects/ui;
    try_files  $uri $uri/ /index.html;
    index  index.html index.htm;
  }

  # 动态资源配置
  location /prod-api/ {
    proxy_set_header  Host $http_host;
    proxy_set_header  X-Real-IP $remote_addr;
    proxy_set_header  REMOTE-HOST $remote_addr;
    proxy_set_header  X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_set_header X-Forwarded-Proto  $scheme;
    proxy_pass  http://server-api/;
  }
}

7.3、Tomcat配置

在101、102、103上分别启动Tomcat,此时访问http://10.108.10.100/index.html,刷新会轮训访问三台Tomcat服务。
至此,解决了Tomcat的高可用性,一台服务器宕机,还有其他两台对外提供服务,同时也可以实现后台服务器的不间断更新。

posted @ 2022-11-07 22:22  Bruce.Chang.Lee  阅读(102)  评论(0编辑  收藏  举报