我们在部署 flask、django 等 python web 框架时,网上最多的教程就是 nginx+gunicorn/uwsgi 的部署方式,那为什么要这么部署呢,本文就来系统地解释这个问题。
必备概念
WSGI
这里必须要知道的一个概念,WSGI,web service gateway interface,网络服务网关接口
它不是 web server,也不是 web application,它是架在 server 和 application 之间的一种协议和规范。
WSGI 的目的就是解耦 web server 和 web application,它包括两个部分,server 和 application,server 用来接收 web 客户端的请求,application 用来接收 server 传来的请求,然后传给 web server
gunicorn
gunicorn 和 uWsgi 就是实现了 WSGI 协议的 web server;
而 flask、django 等 web 框架也是用的 wsgi 协议,所以需要在 web framework 之前加上 gunicorn 或者 uwsgi
话说回来,python web 框架都自带 wsgi 服务器,为什么还要 这俩呢?一句话,性能太差,只能用于开发环节,具体不做过多解释
nginx
nginx 是干什么的呢?参考我的博客 nginx
多层部署的原理
这三者结合起来的效果是什么呢, 我做个简单比喻
flask webServer + flask app:弱鸡版的server,单进程(单 worker),该进程挂掉,web 服务挂掉;无法管理
gunicorn + flask app:多进程(多 worker)server,失败自动重启该 worker,看起来不错哦;简单管理
nginx + gunicorn + flask app:反向代理,负载均衡,是不是更牛了;
多 nginx + 多 gunicorn + 多 web app:大型多实例 web server,一般还会给 gunicorn 挂上 supervisor;
四种模式详解
第一种 server 是 web framework 自带的框架,很容易挂掉,单 worker 工作对多核 cpu 服务器来说是一种浪费;
无法对 worker 进行管理,挂了你不知道,你知道了也只能重启;
而 gunicorn 是可以对 worker 进行管理的
第二种 server 加上了 gunicorn,gunicorn 相当于是开启了多个进程,它具有以下优点:
1. 可以调节 worker 的数量,在请求较多时,自动新增 worker,请求较少时,自动减少 worker;
2. 帮我们管理 worker,worker 挂了自动重启
3. 支持多种配置
4. 各种框架都适用,且部署方法相同
补充:gunicorn 的 管理机制
在管理 worker 上,gunicorn 使用了 pre-fork 模式,即一个 master 进程管理多个 worker 进程,所有请求和响应都由 worker 执行,master 就是一个 loop,监听 worker 不同进程信号并且作出响应。
比如接受到 TTIN 提升 worker 数量,TTOU 降低运行 Worker 数量。如果 worker 挂了,发出 CHLD, 则重启失败的 worker, 同步的 Worker 一次处理一个请求。
看起来不错,但存在以下问题:
1. gunicorn 如果要实现复杂功能,其配置比较复杂
2. gunicorn 有些功能是无法实现的,比如 访问控制、限速、限制连接数等
3. gunicorn 不支持 https,当然高版本支持,但是不如 nginx
4. gunicorn 不支持 http1.1
5. gunicorn 无法扛住巨大的并发量
第三种 server 加上 nginx,只为更加高效更加健壮的 web 服务,nginx 的作用
1. 负载均衡:有效的调度 request,而 gunicorn 虽然是多进程,但是没不能 主动地 对 request 进行调度
2. 动静分离:经过配置后,nginx 可以直接处理静态请求,而无需经过 python web 服务器,这一点 gunicorn 没有
3. 缓存 request 和 response:web 请求包含各种浏览器和各种网络,故 http 请求的发起是一个比较慢的过程,而 gunicorn 需要等待整个请求结束,才处理该请求,并且等 web server 接收完这个请求后,才继续下一个;
nginx 可以缓存客户端的请求,收完整个请求后,转发给 gunicorn,等 gunicorn 返回 response 后,再转发给客户端;
这是 nginx 擅长,而 gunicorn 不擅长
第四种 server 可以通过 nginx 实现 多后端、跨语言后端等 高可用 的负载均衡 web 服务器
总结
只做适合的事,没有绝对的谁只能做什么事;
nginx 功能强大,适合做管理,适合大规模的 web
gunicorn 多进程,充分利用服务器资源,可以支持一些并发量不大的web
总图
参考资料:
https://zhuanlan.zhihu.com/p/36268647 WSGI及gunicorn指北(一)
https://www.zhihu.com/question/297267614/answer/505683007 nginx和gunicorn和flask的关系?
https://www.zhihu.com/question/38528616