Nginx基础

Nginx

Nginx是一个轻量级/高性能的反向代理Web服务器，用于 HTTP、HTTPS、SMTP、POP3 和 IMAP 协议。他实现非常高效的反向代理、负载平衡，他可以处理2-3万并发连接数

优点

跨平台、配置简单。
非阻塞、高并发连接：处理 2-3 万并发连接数，官方监测能支持 5 万并发。
内存消耗小：开启 10 个 Nginx 才占 150M 内存。
成本低廉，且开源。
稳定性高，宕机的概率非常小。
内置的健康检查功能：如果有一个服务器宕机，会做一个健康检查，再发送的请求就不会发送到宕机的服务器了。重新将请求提交到其他的节点上

应用场景

http服务器。Nginx是一个http服务可以独立提供http服务。可以做网页静态服务器。
虚拟主机。可以实现在一台服务器虚拟出多个网站，例如个人网站使用的虚拟机。
反向代理，负载均衡。当网站的访问量达到一定程度后，单台服务器不能满足用户的请求时，需要用多台服务器集群可以使用nginx做反向代理。并且多台服务器可以平均分担负载，不会应为某台服务器负载高宕机而某台服务器闲置的情况。
nginz 中也可以配置安全管理、比如可以使用Nginx搭建API接口网关,对每个接口服务进行拦截。

Nginx请求处理步骤

首先，Nginx 在启动时，会解析配置文件，得到需要监听的端口与 IP 地址，然后在 Nginx 的 Master 进程里面先初始化好这个监控的Socket(创建 Socket，设置 addr、reuse 等选项，绑定到指定的 ip 地址端口，再 listen 监听)。
然后，再 fork(一个现有进程可以调用 fork 函数创建一个新进程。由 fork 创建的新进程被称为子进程)出多个子进程出来。
之后，子进程会竞争 accept 新的连接。此时，客户端就可以向 nginx 发起连接了。当客户端与nginx进行三次握手，与 nginx 建立好一个连接后。此时，某一个子进程会 accept 成功，得到这个建立好的连接的 Socket ，然后创建 nginx 对连接的封装，即 ngx_connection_t 结构体。
接着，设置读写事件处理函数，并添加读写事件来与客户端进行数据的交换。
最后，Nginx 或客户端来主动关掉连接，到此，一个连接就寿终正寝了。

正向代理与反向代理

正向代理:一个位于客户端和原始服务器(origin server)之间的服务器，为了从原始服务器取得内容，客户端向代理发送一个请求并指定目标(原始服务器)，然后代理向原始服务器转交请求并将获得的内容返回给客户端。客户端才能使用正向代理。

反向代理:反向代理（Reverse Proxy）方式，是指以代理服务器来接受 Internet上的连接请求，然后将请求，发给内部网络上的服务器并将从服务器上得到的结果返回给 Internet 上请求连接的客户端，此时代理服务器对外就表现为一个反向代理服务器。

反向代理服务器可以隐藏源服务器的存在和特征。它充当互联网云和web服务器之间的中间层。

Nginx的目录结构与配置文件

tree /usr/local/nginx  
/usr/local/nginx  
├── client_body_temp  
├── conf                             # Nginx所有配置文件的目录  
│   ├── fastcgi.conf                 # fastcgi相关参数的配置文件  
│   ├── fastcgi.conf.default         # fastcgi.conf的原始备份文件  
│   ├── fastcgi_params               # fastcgi的参数文件  
│   ├── fastcgi_params.default         
│   ├── koi-utf  
│   ├── koi-win  
│   ├── mime.types                   # 媒体类型  
│   ├── mime.types.default  
│   ├── nginx.conf                   # Nginx主配置文件  
│   ├── nginx.conf.default  
│   ├── scgi_params                  # scgi相关参数文件  
│   ├── scgi_params.default    
│   ├── uwsgi_params                 # uwsgi相关参数文件  
│   ├── uwsgi_params.default  
│   └── win-utf  
├── fastcgi_temp                     # fastcgi临时数据目录  
├── html                             # Nginx默认站点目录  
│   ├── 50x.html                     # 错误页面优雅替代显示文件，例如当出现502错误时会调用此页面  
│   └── index.html                   # 默认的首页文件  
├── logs                             # Nginx日志目录  
│   ├── access.log                   # 访问日志文件  
│   ├── error.log                    # 错误日志文件  
│   └── nginx.pid                    # pid文件，Nginx进程启动后，会把所有进程的ID号写到此文件  
├── proxy_temp                       # 临时目录  
├── sbin                             # Nginx命令目录  
│   └── nginx                        # Nginx的启动命令  
├── scgi_temp                        # 临时目录  
└── uwsgi_temp                       # 临时目录

配置:

worker_processes  1；# worker进程的数量
events {                                                  # 事件区块开始
    worker_connections  1024；# 每个worker进程支持的最大连接数
}                                                        # 事件区块结束
http {                                                   # HTTP区块开始
    include       mime.types；# Nginx支持的媒体类型库文件
    default_type  application/octet-stream；# 默认的媒体类型
    sendfile        on；# 开启高效传输模式
    keepalive_timeout  65；# 连接超时
    server {                                            # 第一个Server区块开始，表示一个独立的虚拟主机站点
        listen       80；# 提供服务的端口，默认80
        server_name  localhost；# 提供服务的域名主机名
        location / {                                    # 第一个location区块开始
            root   html；# 站点的根目录，相当于Nginx的安装目录
            index  index.html index.htm；# 默认的首页文件，多个用空格分开
            # (解决跨域问题CORS)允许 所有头部 所有域 所有方法
            add_header 'Access-Control-Allow-Origin' '*';
            add_header 'Access-Control-Allow-Headers' '*';
            add_header 'Access-Control-Allow-Methods' '*';
        }                                                  # 第一个location区块结果
        error_page   500502503504  /50x.html；# 出现对应的http状态码时，使用50x.html回应客户
        location = /50x.html {                          # location区块开始，访问50x.html
            root   html；# 指定对应的站点目录为html
        }
    }  
    # 当客户端访问www.zdk.com,监听端口号为80,直接跳转到data/www目录下文件
    server {
        listen       80;
        server_name  www.zdk.com;
        location / {
            # 指定上游服务器负载均衡服务器
            proxy_pass http://backServer;
            # nginx与上游服务器(真实访问的服务器)超时时间 后端服务器连接的超时时间_发起握手等候响应超时时间
            proxy_connect_timeout 1s;
            # nginx发送给上游服务器(真实访问的服务器)超时时间
            proxy_send_timeout 1s;
            # nginx接收上游服务器(真实访问的服务器)超时时间
            proxy_read_timeout 1s;
            index  index.html index.htm;
        }
    }

    # 当客户端访问www.zdk.com,监听端口号为80,直接跳转到data/bbs目录下文件
     server {
        listen       80;
        server_name  bbs.zdk.com;
        location / {
            root   data/bbs;
            index  index.html index.htm;
        }
    }
    
    # 当客户端访问www.zdk.com,监听端口号为8080,直接跳转到data/www目录下文件
     server {
        listen       8080;
        server_name  8080.zdk.com;
        location / {
            root   data/www;
            index  index.html index.htm;
        }
    }

    # 当客户端访问www.zdk.com,监听端口号为80直接跳转到真实ip服务器地址 127.0.0.1:8080
    server {
        listen       80;
        server_name  www.zdk.com;
        location / {
            proxy_pass http://127.0.0.1:8080;
            index  index.html index.htm;
        }
    }
    
}

location指令的作用是根据用户请求的URI来执行不同的应用，也就是根据用户请求的网站URL进行匹配，匹配成功即进行相关的操作。

location的匹配表达式:

匹配符	匹配规则	优先级
=	精确匹配	1
^~	以某个字符串开头	2
~	区分大小写的正则匹配	3
~*	不区分大小写的正则匹配	4
!~	区分大小写不匹配的正则	5
!~*	不区分大小写不匹配的正则	6
/	通用匹配,匹配所有请求	7

location匹配示例:

# 优先级1,精确匹配，根路径
location =/ {
    return 400;
}

# 优先级2,以某个字符串开头,以av开头的，优先匹配这里，区分大小写
location ^~ /av {
   root /data/av/;
}

# 优先级3，区分大小写的正则匹配，匹配/media*****路径
location ~ /media {
      alias /data/static/;
}

# 优先级4 ，不区分大小写的正则匹配，所有的****.jpg|gif|png 都走这里
location ~* .*\.(jpg|gif|png|js|css)$ {
   root  /data/av/;
}

# 优先7，通用匹配
location / {
    return 403;
}

Rewrite全局变量

$remote_addr        //获取客户端ip
$binary_remote_addr //客户端ip（二进制)
$remote_port        //客户端port，如：50472
$remote_user        //已经经过Auth Basic Module验证的用户名
$host           //请求主机头字段，否则为服务器名称，如:blog.sakmon.com
$request        //用户请求信息，如：GET ?a=1&b=2 HTTP/1.1
$request_filename   //当前请求的文件的路径名，由root或alias和URI request组合而成，如：/2013/81.html
$status         //请求的响应状态码,如:200
$body_bytes_sent        // 响应时送出的body字节数数量。即使连接中断，这个数据也是精确的,如：40
$content_length        // 等于请求行的“Content_Length”的值
$content_type          // 等于请求行的“Content_Type”的值
$http_referer          // 引用地址
$http_user_agent      // 客户端agent信息,如：Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.76 Safari/537.36
$args            //与$query_string相同 等于当中URL的参数(GET)，如a=1&b=2
$document_uri        //与$uri相同  这个变量指当前的请求URI，不包括任何参数(见$args) 如:/2013/81.html
$document_root       //针对当前请求的根路径设置值
$hostname        //如：centos53.localdomain
$http_cookie        //客户端cookie信息
$cookie_COOKIE      //cookie COOKIE变量的值
$is_args    //如果有$args参数，这个变量等于”?”，否则等于”"，空值，如?
$limit_rate //这个变量可以限制连接速率，0表示不限速
$query_string       // 与$args相同 等于当中URL的参数(GET)，如a=1&b=2
$request_body      // 记录POST过来的数据信息
$request_body_file  //客户端请求主体信息的临时文件名
$request_method       //客户端请求的动作，通常为GET或POST,如：GET
$request_uri          //包含请求参数的原始URI，不包含主机名，如：/2013/81.html?a=1&b=2
$scheme            //HTTP方法（如http，https）,如：http
$uri            //这个变量指当前的请求URI，不包括任何参数(见$args) 如:/2013/81.html
$request_completion //如果请求结束，设置为OK. 当请求未结束或如果该请求不是请求链串的最后一个时，为空(Empty)，如：OK
$server_protocol    //请求使用的协议，通常是HTTP/1.0或HTTP/1.1，如：HTTP/1.1
$server_addr        //服务器IP地址，在完成一次系统调用后可以确定这个值
$server_name        //服务器名称，如：blog.sakmon.com
$server_port        //请求到达服务器的端口号,如：80

Nginx的负载均衡

Nginx负载均衡实现的策略有以下五种：

轮询(默认)

每个请求按时间顺序逐一分配到不同的后端服务器，如果后端某个服务器宕机，能自动剔除故障系统。

upstream backserver {   
 server 192.168.0.12;   
 server 192.168.0.13;   
}

权重 weight

weight的值越大，分配到的访问概率越高，主要用于后端每台服务器性能不均衡的情况下。其次是为在主从的情况下设置不同的权值，达到合理有效的地利用主机资源。

# 权重越高，在被访问的概率越大，如上例，分别是20%，80%。
upstream backserver {   
 server 192.168.0.12 weight=2;   
 server 192.168.0.13 weight=8;   
}

ip_hash(IP绑定)

每个请求按访问IP的哈希结果分配，使来自同一个IP的访客固定访问一台后端服务器，并且可以有效解决动态网页存在的session共享问题

upstream backserver {   
 ip_hash;   
 server 192.168.0.12:88;   
 server 192.168.0.13:80;   
}

fair(第三方插件)

必须安装upstream_fair模块。对比 weight、ip_hash更加智能的负载均衡算法，fair算法可以根据页面大小和加载时间长短智能地进行负载均衡，响应时间短的优先分配。

# 哪个服务器的响应速度快，就将请求分配到那个服务器上。
upstream backserver {   
 server server1;   
 server server2;   
 fair;   
}

url_hash(第三方插件)

必须安装Nginx的hash软件包按访问url的hash结果来分配请求，使每个url定向到同一个后端服务器，可以进一步提高后端缓存服务器的效率。

upstream backserver {   
 server squid1:3128;   
 server squid2:3128;   
 hash $request_uri;   
 hash_method crc32;   
}

Nginx的限流

Nginx限流就是限制用户请求速度，防止服务器受不了限流有3种

正常限制访问频率（正常流量）
突发限制访问频率（突发流量）
限制并发连接数

Nginx的限流都是基于漏桶流算法

正常限制访问频率（正常流量）

限制一个用户发送的请求，我Nginx多久接收一个请求。

Nginx中使用ngx_http_limit_req_module模块来限制的访问频率，限制的原理实质是基于漏桶算法原理来实现的。在nginx.conf配置文件中可以使用limit_req_zone命令及limit_req命令限制单个IP的请求处理频率。

# 定义限流维度，一个用户一分钟一个请求进来，多余的全部漏掉
# 1r/s代表1秒一个请求，1r/m一分钟接收一个请求， 如果Nginx这时还有别人的请求没有处理完，Nginx就会拒绝处理该用户请求。
limit_req_zone $binary_remote_addr zone=one:10m rate=1r/m;

# 绑定限流维度
server{
    location/seckill.html{
        limit_req zone=zone;    
        proxy_pass http://lj_seckill;
    }

}

突发限制访问频率（突发流量）

限制一个用户发送的请求，我Nginx多久接收一个。

上面的配置一定程度可以限制访问频率，但是也存在着一个问题：如果突发流量超出请求被拒绝处理，无法处理活动时候的突发流量，这时候应该如何进一步处理呢？

Nginx提供burst参数结合nodelay参数可以解决流量突发的问题，可以设置能处理的超过设置的请求数外能额外处理的请求数。我们可以将之前的例子添加burst参数以及nodelay参数：
```
# 定义限流维度，一个用户一分钟一个请求进来，多余的全部漏掉
limit_req_zone $binary_remote_addr zone=one:10m rate=1r/m;

# 绑定限流维度
server{
    location /seckill.html{
        limit_req zone=zone burst=5 nodelay;
        proxy_pass http://lj_seckill;
    }

}
```
多了一个 burst=5 nodelay; 可以代表Nginx对于一个用户的请求会立即处理前五个，多余的就慢慢来落，没有其他用户的请求我就处理你的，有其他的请求的话我Nginx就漏掉不接受你的请求.
限制并发连接数

Nginx中的ngx_http_limit_conn_module模块提供了限制并发连接数的功能，可以使用limit_conn_zone指令以及limit_conn执行进行配置。接下来我们可以通过一个简单的例子来看下：
```
http {
    limit_conn_zone $binary_remote_addr zone=myip:10m;
    limit_conn_zone $server_name zone=myServerName:10m;
}

server {
    location / {
        limit_conn myip 10;
        limit_conn myServerName 100;
        rewrite / http://www.lijie.net permanent;
    }
}
```
上面配置了单个IP同时并发连接数最多只能10个连接，并且设置了整个虚拟服务器同时最大并发数最多只能100个链接。当然，只有当请求的header被服务器处理后，虚拟服务器的连接数才会计数。刚才有提到过Nginx是基于漏桶算法原理实现的，实际上限流一般都是基于漏桶算法和令牌桶算法实现的。

posted @ 2022-05-02 22:11 Abserver 阅读(68) 评论(0) 收藏举报

刷新页面返回顶部

Abserver

初来乍到