利用epoll实现异步IO
之前异步IO一直没搞明白,大致的理解就是在一个大的循环中,有两部分:第一部分是监听事件;第二部分是处理事件(通过添加回调函数的方式)。就拿网络通信来说,可以先通过调用 select 模块中的 select 监听各个 socket 。当 socket 有事件到来时,针对相应的事件做出处理,就这么一直循环下去。所以异步IO也被称为事件驱动IO。原理其实我说得太简单了,所以我会以一个例子来说明一切。不过在这之前我还是要说一下 select 和 epoll 的区别。
一、IO多路服用的select
IO多路复用相对于阻塞式和非阻塞式的好处就是它可以监听多个 socket ,并且不会消耗过多资源。当用户进程调用 select 时,它会监听其中所有 socket 直到有一个或多个 socket 数据已经准备好,否则就一直处于阻塞状态。select的缺点在于单个进程能够监视的文件描述符的数量存在最大限制,select()所维护的存储大量文件描述符的数据结构,随着文件描述符数量的增大,其复制的的开销也线性增长。同时,由于网络响应时间的延迟使得大量的tcp链接处于非常活跃状态,但调用select()会对所有的socket进行一次线性扫描,所以这也浪费了一定的开销。不过它的好处还有就是它的跨平台特性。
二、 异步IO的epoll
epoll的优点就是完全的异步,你只需要对其中 poll 函数注册相应的 socket 和事件,就可以完全不管。当有时间发生时,数据已经从内核态拷贝到用户态,也就是完全没有阻塞。
三、基于epoll的聊天室程序
说了这么多,我决定还是用epoll写一个多人聊天程序。epoll可以支持大量连接,select却有限制,所以这就是我决定用epoll的原因。首先看服务器程序:
1 import socket, select 2 # 服务端 3 4 serverSock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 5 serverSock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, True) 6 serverSock.bind(('127.0.0.1', 8001)) 7 serverSock.listen(5) 8 serverSock.setblocking(False) 9 10 EOL = bytes('\n\n', 'utf-8') 11 QUIT = bytes('\r\n', 'utf-8') 12 epoll = select.epoll() 13 epoll.register(serverSock.fileno(), select.EPOLLIN) 14 print('注册事件:%s'%serverSock.fileno()) 15 16 try: 17 connections = {}; requests = {}; responses = {} 18 while True: 19 events = epoll.poll(1) 20 for fileno, event in events: 21 # print('event:%s fileno:%s'%(event, fileno)) 22 if fileno == serverSock.fileno(): 23 clientSock, address = serverSock.accept() 24 print('连接到客户端: %s:%s'%(address[0], address[1])) 25 clientSock.setblocking(False) 26 connections[clientSock.fileno()] = (clientSock, address) 27 epoll.register(clientSock.fileno(), select.EPOLLOUT) # socket只能注册输入或输出一个,不能同时注册 28 requests[clientSock.fileno()] = bytes('', 'utf-8') 29 responses[clientSock.fileno()] = bytes('你已连接到服务器,IP为{}:{}\n\n'.format(*serverSock.getsockname()), 30 'utf-8') 31 elif event & select.EPOLLIN: 32 requests[fileno] += connections[fileno][0].recv(1024) 33 if requests[fileno].endswith(EOL): 34 msg = str(requests[fileno], 'utf-8') 35 msg = '来自{}的消息:{}'.format(connections[fileno][1], msg[:-2]) 36 requests[fileno] = b'' 37 #print(msg) 38 for i in responses: 39 if i == fileno: 40 continue 41 responses[i] += bytes(msg, 'utf-8') 42 epoll.modify(i, select.EPOLLOUT) 43 if QUIT in requests[fileno]: 44 epoll.modify(fileno, select.EPOLLOUT) 45 46 elif event & select.EPOLLOUT: 47 #print('开始发送消息:%s'%str(responses[fileno], 'utf-8')) 48 bytesSend = connections[fileno][0].send(responses[fileno]) 49 responses[fileno] = responses[fileno][bytesSend:] 50 #print('发送完成') 51 if responses[fileno] == b'': 52 epoll.modify(fileno, select.EPOLLIN) 53 if QUIT in requests[fileno]: 54 epoll.modify(fileno, 0) 55 connections[fileno][0].shutdown(socket.SHUT_RDWR) 56 57 elif event & select.EPOLLHUP: 58 epoll.unregister(fileno) 59 connections[fileno][0].close() 60 del connections[fileno] 61 finally: 62 epoll.unregister(serverSock.fileno()) 63 epoll.close() 64 serverSock.close() 65 print('已退出服务端程序')
注意,我首先定义了两个终止符:EOL表示这段话已经发完了;QUIT表示客户端想要退出。客户端的程序有点让我为难,既要在命令行输入又要同时保证能输出别人发过来的消息,所有我只好用了prompt_toolkit再加上一个线程。如下:
1 import socket, prompt_toolkit, select 2 import threading, queue 3 4 5 class Client: 6 def __init__(self, sock): 7 self.sock = sock 8 self.want_to_send = False 9 self.want_to_recv = True 10 self._msg = queue.Queue() 11 12 def fileno(self): 13 return self.sock.fileno() 14 15 def handle_recv(self): 16 print('接受消息..') 17 msg = self.sock.recv(1024) 18 print(str(msg, 'utf-8')) 19 20 def handle_send(self): 21 msg = self._msg.get() 22 if msg == '\r\n': 23 self.want_to_send = False 24 self.want_to_recv = False 25 self.sock.sendall(bytes(msg, 'utf-8')) 26 self.want_to_send = False 27 28 def handle_sock(want_to_send, want_to_recv, sock): 29 print('开始处理消息...') 30 want_to_recv.append(sock.fileno()) 31 while True: 32 if sock.want_to_send: 33 if not want_to_send: 34 want_to_send.append(myclient.fileno()) 35 else: 36 want_to_send.clear() 37 can_recv, can_send, _ = select.select(want_to_recv, want_to_send, [], 1) 38 if can_recv: 39 sock.handle_recv() 40 if can_send: 41 sock.handle_send() 42 if not (sock.want_to_send or sock.want_to_recv): 43 print('正停止客户端连接...') 44 break 45 if sock._msg.qsize(): 46 sock.want_to_send = True 47 48 49 s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 50 s.connect(('127.0.0.1',8001)) 51 52 myclient = Client(s) 53 want_to_send = [] 54 want_to_recv = [] 55 56 57 58 t = threading.Thread(target=handle_sock, 59 args=(want_to_send, want_to_recv, myclient), 60 daemon=True) 61 t.start() 62 63 try: 64 while True: 65 messages = prompt_toolkit.shortcuts.prompt('\n\n>>> ',patch_stdout=True) 66 myclient._msg.put(messages+'\n\n') 67 except KeyboardInterrupt: 68 myclient._msg.put('\r\n') 69 finally: 70 t.join() 71 myclient.sock.close() 72 print('网络已断开')
我的服务器跑在 jupyter 上,客户端跑在命令行上,效果如下:
客户端接受和发送消息都是互不影响的,这样就实现了一个多人聊天的功能。而且服务器使用的是epoll,所以哪怕是成千上万的人同时在线也没有任何压力。至于怎么测试暂时还没想到办法。