TOP

4.6 并发编程/IO模型

 并发编程/IO模型

背景概念

IO模型概念

IO模型分类

阻塞IO  (blocking IO)

特点: 

    两个阶段(等待数据和拷贝数据两个阶段)都被block

设置

server.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)

解决方案: 

    启用多线程或者多进程,要阻塞只阻塞当前线程/进程,不会影响其他进程/线程

不良影响:

    当遇到过多得链接请求时会严重占用资源,降低响应效率

修复不良影响:

    启用进程池/线程池 ,降低进程/线程数量

 仍旧未解决的不良影响:

    池得数量不好规范,请求数量和池大小不好对应,且池存在数量上限

    只是一定程度上限制了不良影响,无法根本解决

  总结 :

    基于池得创建可以解决小规模得服务请求带来的压力,对于大规模还是无力回天

非阻塞IO  (nonblocking IO)

  特点: 

    基于IO阻塞模型类似,再本应阻塞得地方不在阻塞,如果未收到想要数据会返回一个 error 给用户告知无数据

    发送 error 后会进行其他得任务继续操作背后会一直对 kernel 进行轮询发送数据请求,

    这期间如果数据到了就会重新正常操作,而在轮询期间,无数据得进程会一直处于阻塞状态

    就结果而言。完全得实现了并发,以及解决了IO阻塞带来得效率低下的问题

设置

server.setblocking()    #默认是True  
server.setblocking(False)     #False的话就成非阻塞了,这只是对于socket套接字来说的 

不良影响:

    1. 虽说解决了单线程并发,但是大大的占用了cpu

    2.  任务完成的响应延迟增大,任务可能在两次轮询之间的任意时间完成。这会导致整体数据吞吐量的降低

  总结 :

    完全不推荐

多路复用IO  (IO multiplexing)

  特点: 

    当用户进程调用了select,那么整个进程会被block

    而同时,kernel会“监视”所有select负责的socket,当任何一个socket中的数据准备好了,select就会返回。

    这个时候用户进程再调用read操作,将数据从kernel拷贝到用户进程。

    这个图和blocking IO的图其实并没有太大的不同,事实上还更差一些。

    因为这里需要使用两个系统调用(select和recvfrom),而blocking IO只调用了一个系统调用(recvfrom)。但是,用select的优势在于它可以同时处理多个connection。

设置

使用 select 模块 或者 eppol (只能用于 linux 中)
最优的选择方案是用 selectors

    selectors 实例 

#服务端
from socket import *
import selectors

sel=selectors.DefaultSelector()
def accept(server_fileobj,mask):
    conn,addr=server_fileobj.accept()
    sel.register(conn,selectors.EVENT_READ,read)

def read(conn,mask):
    try:
        data=conn.recv(1024)
        if not data:
            print('closing',conn)
            sel.unregister(conn)
            conn.close()
            return
        conn.send(data.upper()+b'_SB')
    except Exception:
        print('closing', conn)
        sel.unregister(conn)
        conn.close()



server_fileobj=socket(AF_INET,SOCK_STREAM)
server_fileobj.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
server_fileobj.bind(('127.0.0.1',8088))
server_fileobj.listen(5)
server_fileobj.setblocking(False) #设置socket的接口为非阻塞
sel.register(server_fileobj,selectors.EVENT_READ,accept) #相当于网select的读列表里append了一个文件句柄server_fileobj,并且绑定了一个回调函数accept

while True:
    events=sel.select() #检测所有的fileobj,是否有完成wait data的
    for sel_obj,mask in events:
        callback=sel_obj.data #callback=accpet
        callback(sel_obj.fileobj,mask) #accpet(server_fileobj,1)

#客户端
from socket import *
c=socket(AF_INET,SOCK_STREAM)
c.connect(('127.0.0.1',8088))

while True:
    msg=input('>>: ')
    if not msg:continue
    c.send(msg.encode('utf-8'))
    data=c.recv(1024)
    print(data.decode('utf-8'))
View Code

不良影响:

    1. 虽说解决了单线程并发,但是大大的占用了cpu

    2.  任务完成的响应延迟增大,任务可能在两次轮询之间的任意时间完成。这会导致整体数据吞吐量的降低

  总结 :

    select的优势在于可以处理多个连接,不适用于单个连接

异步IO(asynchronous IO)

  用户进程发起read操作之后,立刻就可以开始去做其它的事。

  kernel 受到一个asynchronous read之后,首先它会立刻返回,所以不会对用户进程产生任何block。

  然后,kernel会等待数据准备完成,然后将数据拷贝到用户内存,

  当这一切都完成之后,kernel会给用户进程发送一个signal,告诉它read操作完成了。

socketserver 模块

 包含类

  BaseServer是基类,它不能实例化使用,

  TCPServer使用TCP协议通信,

  UDPServer使用UDP协议通信,

  UnixStreamServer和UnixDatagramServer使用Unix域套接字,只适用于UNIX平台。

  ForkingMixIn 多进程异步

  ThreadingMixIn 多线程异步 

如何创建一个socketserver :

  1. 创建一个请求处理的类,继承 BaseRequestHandlerclass ,要重写父类里 handle() 方法;

  2. 你必须实例化 TCPServer,并且传递server IP和你上面创建的请求处理类,给这个TCPServer;

  3. server.handle_requese()  只处理一个请求,server.server_forever() 处理多个一个请求,永远执行

  4. 关闭连接 server_close()

import socketserver

class MyTCPHandler(socketserver.BaseRequestHandler): #服务类,监听绑定等等
  
 
    def handle(self):  #请求处理类,所有请求的交互都是在handle里执行的
        # self.request is the TCP socket connected to the client
        self.data = self.request.recv(1024).strip()  #每一个请求都会实例化MyTCPHandler(socketserver.BaseRequestHandler):
        print("{} wrote:".format(self.client_address[0]))
        print(self.data)
        self.request.sendall(self.data.upper())  #sendall是重复调用send.

if __name__ == "__main__":
    HOST, PORT = "localhost", 9999

    server = socketserver.TCPServer((HOST, PORT), MyTCPHandler)

    # Activate the server; this will keep running until you
    # interrupt the program with Ctrl-C
    server.serve_forever()
 
 server = socketserver.ThreadingTCPServer((HOST, PORT), MyTCPHandler)   #线程
# server  = socketserver.ForkingTCPServer((HOST, PORT), MyTCPHandler) #多进程 linux适用
# server = socketserver.TCPServer((HOST, PORT), MyTCPHandler) 单进程

ThreadingTCPServer

  服务器内部会为每个client创建一个 “线程”,该线程用来和客户端进行交互。

import SocketServer

class MyServer(SocketServer.BaseRequestHandler):

    def handle(self):
        pass

if __name__ == '__main__':
    server = SocketServer.ThreadingTCPServer(('127.0.0.1',8766), MyServer)
    server.serve_forever()

ForkingTCPServer

  用法类似 ThreadingTCPServer 只是将线程换成了进程 

import SocketServer

class MyServer(SocketServer.BaseRequestHandler):

    def handle(self):
        pass

if __name__ == '__main__':
    server = SocketServer.ForkingTCPServer(('127.0.0.1',8009),MyServer)
    server.serve_forever()

 总结:

socketserver 完美的解决了之前的各种困扰。不论是并发问题还是线程池大小以及IO问题都被解决。

  因此socketserver成为了最终解决方案

 

posted @ 2019-01-31 18:53  羊驼之歌  阅读(339)  评论(0编辑  收藏  举报