Nginx原理
1. nginx基本介绍
1、Nginx 是什么
Nginx 是异步框架的网页服务器,也可以用作反向代理、负载平衡器和 HTTP 缓存。大部分 Web 服务器使用 Nginx,通常作为负载均衡器。Nginx 是免费的开源软件,根据类 BSD 许可证的条款发布。
2、nginx高并发原理( 多进程+epoll实现高并发 )
1. Nginx 在启动后,会有一个 master 进程和多个相互独立的 worker 进程。
2. 每个子进程只有一个线程,采用的 IO多路复用模型epoll,实现高并发。
3、epoll能实现高并发原理
1. epoll() 中内核则维护一个链表,epoll_wait 方法可以获取到链表长度,不为0就知道文件描述符准备好了。
2. 在内核实现中 epoll 是根据每个 sockfd 上面的与设备驱动程序建立起来的回调函数实现的。
3. 某个 sockfd 上的事件发生时,与它对应的回调函数就会被调用,来把这个 sockfd 加入链表,其他处于“空闲的”状态的则不会。
4. epoll上面链表中获取文件描述,这里使用内存映射(mmap)技术, 避免了复制大量文件描述符带来的开销
内存映射(mmap):内存映射文件,是由一个文件到一块内存的映射,将不必再对文件执行I/O操作
4、nginx和apache比较
1)nginx相对于apache的优点
1. 轻量级,同样起web 服务,比apache 占用更少的内存及资源
2. 抗并发,nginx 处理请求是异步非阻塞的,而apache 则是阻塞型的,在高并发下nginx 能保持低资源低消耗高性能
3. 高度模块化的设计,编写模块相对简单,社区活跃,各种高性能模块出品迅速啊
2)apache 相对于nginx 的优点
1. apache 更为成熟,少 bug ,稳定性好
2. rewrite ,比nginx 的rewrite 强大
3. 模块超多,基本想到的都可以找到
2. nginx正向代理 & 反向代理
关于代理
说到代理,首先我们要明确一个概念,所谓代理就是一个代表、一个渠道;此时就涉及到两个角色,一个是被代理角色,一个是目标角色。被代理角色通过这个 代理访问目标角色完成一些任务的过程称为代理操作过程;如同生活中的专卖店,客人到 adidas 专卖店买了一双鞋,这个专卖店就是代理,被代理角色就是 adidas 厂家,目标角色就是用户。
1、正向代理
1. 我访问不了某网站,但是我能访问一个代理服务器,这个代理服务器呢,他能访问那个我不能访问的网站
2. 于是我先连上代理服务器,告诉他我需要那个无法访问网站的内容,代理服务器去取回来,然后返回给我。
3. 客户端必须设置正向代理服务器,当然前提是要知道正向代理服务器的IP地址,还有代理程序的端口。
4. 例如之前使用过这类软件例如CCproxy,http://www.ccproxy.com/ 需要在浏览器中配置代理的地址。
正向代理作用:
1)访问原来无法访问的资源,如google
2) 可以做缓存,加速访问资源
3)对客户端访问授权,上网进行认证
4)代理可以记录用户访问记录(上网行为管理),对外隐藏用户信息
2、反向代理
1. 反向代理对用户透明,客户端无需任何配置即可访问服务。
2. 实际运行方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器。
3. 并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个服务器。
3、反向代理使用场景
1)保证内网的安全,可以使用反向代理提供WAF功能,阻止web攻击
例:大型网站,通常将反向代理作为公网访问地址,Web服务器是内网
2)负载均衡,通过反向代理服务器来优化网站的负载
4、Nginx 支持的负载均衡调度算法方式如下:
1.weight 轮询(默认):
1)接收到的请求按照顺序逐一分配到不同的后端服务器,即使在使用过程中,某一台后端服务器宕机,Nginx 会自动将该服务器剔除出队列,请求受理情况不会受到任何影响。
2)这种方式下,可以给不同的后端服务器设置一个权重值(weight),用于调整不同的服务器上请求的分配率。
3)权重数据越大,被分配到请求的几率越大;该权重值,主要是针对实际工作环境中不同的后端服务器硬件配置进行调整的。
2.ip_hash:
每个请求按照发起客户端的 ip 的 hash 结果进行匹配,这样的算法下一个固定 ip 地址的客户端总会访问到同一个后端服务器,这也在一定程度上解决了集群部署环境下 Session 共享的问题。
3.fair:
1)智能调整调度算法,动态的根据后端服务器的请求处理到响应的时间进行均衡分配。
2)响应时间短处理效率高的服务器分配到请求的概率高,响应时间长处理效率低的服务器分配到的请求少,它是结合了前两者的优点的一种调度算法。
3)但是需要注意的是 Nginx 默认不支持 fair 算法,如果要使用这种调度算法,请安装 upstream_fair 模块。
4.url_hash:
1)按照访问的 URL 的 hash 结果分配请求,每个请求的 URL 会指向后端固定的某个服务器,可以在 Nginx 作为静态服务器的情况下提高缓存效率。
2)同样要注意 Nginx 默认不支持这种调度算法,要使用的话需要安装 Nginx 的 hash 软件包。