原文:https://www.jianshu.com/p/3fc801878e72

WSGI规范

1.WSGI协议

什么是WSGI
(1)、WSGI(Web 服务器网关接口)是python中所定义的Web Server和Web APP之间或框架之间的接口标准规范
(2)、WSGI接口规范的目的就是规范Web服务器与Web应用之间的交互,在协议之间进行转换
(3)、WSGI将Web组件分成三类:Web服务器(Server)、Web中间件(Middleware)与Web应用程序(APP)。

WSGI APP:指的是可以被调用的一个对象,一般指的是包含一个__call__方法的类的实例或者一个函数。
WSGI Server:指的是实现了调用应用的部分。
WSGI Middleware:处于服务器和应用两侧,起粘合作用,具体包括:请求处理、environ处理。

2.什么是WSGI APP

WSGI APP是一个可调用的对象(callable object),常用的可调用的对象有三种:

1.一个函数或者类的方法
2.一个实现__call__()方法的类的实例
3.一个类:调用类时会运行类的 __new__ 方法创建一个实例,然后运行 __init__ 方法,初始化实例,最后把实例返回给调用方。因为 Python 没有 new 运算符,所以调用类相当于调用函数。(通常,调用类会创建那个类的实例,不过覆盖 __new__ 方法的话,也可能出现其他行为。)

这个对象接收两个参数environ和start_response。
environ是一个字典,里面储存了HTTP request的所有内容。而start_response是一个WSGI Server传递过来的函数,用于将response header,status传递给Server。并且它还需要返回一个可迭代的值,用于将response body传递给Server。
以可调用对象为一个类为例:

class application:
   def __call__(self, environ, start_response):
   status = '200 OK'
   response_headers = [('Content-type', 'text/plain')]
   start_response(status, response_headers)
   return [u"This is hello wsgi app".encode('utf8')

  

WSGI APP使用start_response(status, response_headers)这个函数将response header,status传递给Server,使用return(调用返回)将response body传递给Server,即将一个http response通过两个途径返回给了Server。

在OpenStack中,为了简化程序的书写,经常使用WebOb包中的wsgify装饰器将一个函数变为WSGI APP

class webob.dec.wsgify(func=None, RequestClass=None, args=(), kwargs=None, middleware_wraps=None)

如下所示

from webob.dec import wsgify
from webob import Request,Response
@wsgify
def myfunc(req):
    return Response('hey there')

  

此时APP的输入变成封装了environ字典的一个Request类,并且直接返回一个封装了所有http response信息的Response类即可。
装饰器还可以自定义,一般通过一个继承了webob.Request的子类(比如MyRequest)来实现,如下:

class MyRequest(webob.Request):  #python中的继承,子类继承Request类
    @property                    #只读
    def is_local(self):     
        return self.remote_addr == '127.0.0.1' 

@wsgify(RequestClass=MyRequest)
def myfunc(req):
    if req.is_local:
        return Response('hi!')
    else:
        raise webob.exc.HTTPForbidden

  

可以看到,经过这种方式,我们在Server和APP之间实现了一层过滤地址的功能(本机地址可以访问,其他地址则拒绝访问),实际上就实现了一个Middleware。

WebOb包的官方英文文档链接:https://docs.pylonsproject.org/projects/webob/en/latest/reference.html
关于environ字典和WebOb包的总结:https://www.jianshu.com/p/c62a4a2f5dd6

3.WSGI Server

WSGI Server需要调用WSGI APP

def run(application):#服务器程序调用应用程序

    environ = {}#设定参数

    def start_response(xxx):#设定参数

        pass

    result = application(environ, start_response)#调用APP的__call__函数(这里APP是一个类)

    def write(data):

        pass

    def data in result:#迭代访问

        write(data)

  

服务器程序主要做了以下的事:

  1\. 设定app所需要的参数(environ,start_response)

  2\. 调用app

  3\. 迭代访问app的返回结果(response body),并传给客户端

但实际上已经有很多已经封装好的WSGI Server供我们使用,只需简单的将APP与一些其他的参数绑定来创建一个Server,而这个Server会将它接收到的request传递给绑定的APP。
如最简单,常用于实验环境中启动一个Server的方法,如下所示:

from paste import httpserver
def application(environ, start_response)
    pass

httpserver.serve(application, host = '127.0.0.1', port = 8080)

  

上面的方法是使用进程启动,一个进程对应一个服务(Server),对服务地启动、关闭、暂停都需要直接对进程进行操作,开销较大,而在OpenStack中,常用eventlet(绿色线程)来启动服务。

class Server(object)
  def __init__(self, app, host = '0.0.0.0', port = 0):
    #线程池,允许并行访问
    self._pool = eventlet.GreePool(10)
    #WSGI server的应用程序,由调用者传入!!!
    self.app = app
    #根据传入的参数创建监听socket
    self._socket = eventlet.listen((host, port), backlog = 10)
    #获取监听的地址和端口放到__dict__字典中,然后打印出来
    (self.host, self.port) = self._socket.getsockname()
    print("Listen on %(host)s:%(port)s" %self.__dict__)

  #start方法,由初始化的参数创建服务线程,注意需要传入app
  def start(self)
    self._server = eventlet.spawn(event.wsgi.server,
                                  self._socket
                                  self.app
                                  protocol = eventlet.wsgi.HttpProtocol,
                                  custom_pool = self._pool

  #stop方法,终止线程
  def stop(self):
    if self._server is not None:
       self._pool.resize(0)
       self._server.kill()

  #wait方法,监听http请求
  def wait(self):
    try:
      self._server.wait()
    except greenlet.GreeletExit:
      print("WSGI server has stopped.")

  

上面将WSGI Server封装到了一个Server类中,并通过传入WSGI APP参数创建Server实例来启动一个WSGI Server,但需要注意的是Server与APP并非简单的一对一或一对多的关系。

4.WSGI Middleware

WSGI Middleware(中间件)是介于服务器程序和应用程序中间的部分,Middleware对Server和APP是透明的。
从实现上来说,Middleware和APP的输入和返回是一样的,只不过Middleware接收Server传递过来的request,经过自己的逻辑处理后(如路由,过滤),选择是调用下一个APP获取response返回或者直接返回response(如404,403等)。因此,Middleware就是中间APP。
Server获取到了客户端请求的URL,需要把URL交给不同的APP处理,这个功能可以使用Middleware实现:

# URL Routing middleware
def urlrouting(url_app_mapping):   
     def midware_app(environ, start_response):       #函数可调用,包含2个参数,返回可迭代的值
          url = environ['PATH_INFO']       
          app = url_app_mapping(url)       #获得对应url的应用程序
          result = app(environ, start_response)       #调用应用程序
          return result       
     return midware_app

  

函数midware_app就是Middleware(也是一个APP),调用流程:

1.实现一个url_app_mapping(url)函数,它传入url并返回请求的app
2.调用middleware_app = urlrouting(url_app_mapping)得到中间件app
3.使用middleware_app创建server

def url_app_mapping(url):
  pass

middleware_app = urlrouting(url_app_mapping)
server = make_server('ip',port,middleware_app)
server.serve_forever

  

Middleware 处于Server和APP之间,每个 Middleware 实现不同的功能,我们通常根据需求选择相应的 Middleware 并组合起来,实现所需的功能。其作用有以下几点:
• 根据 url 把用户请求调度到不同的 application 中。
• 负载均衡,转发用户请求
• 预处理 XSL 等相关数据
• 限制请求速率,设置白名单