Part 11.网络编程--解决并发服务器的几种方法
(一)单进程服务器
1 from socket import * 2 3 serSocket = socket(AF_INET, SOCK_STREAM) 4 5 # 重复使用绑定的信息,当我们服务器先挂掉时,不会影响客户端的操作 6 serSocket.setsockopt(SOL_SOCKET, SO_REUSEADDR , 1) 7 8 localAddr = ('', 7788) 9 10 serSocket.bind(localAddr) 11 12 serSocket.listen(5) 13 14 while True: 15 16 print('-----主进程,,等待新客户端的到来------') 17 18 newSocket,destAddr = serSocket.accept() 19 20 print('-----主进程,,接下来负责数据处理[%s]-----'%str(destAddr)) 21 22 try: 23 while True: 24 recvData = newSocket.recv(1024) 25 if len(recvData)>0: 26 print('recv[%s]:%s'%(str(destAddr), recvData)) 27 else: 28 print('[%s]客户端已经关闭'%str(destAddr)) 29 break 30 finally: 31 newSocket.close() 32 33 serSocket.close()
总结
- 同一时刻只能为一个客户进行服务,不能同时为多个客户服务
- 类似于找一个“明星”签字一样,客户需要耐心等待才可以获取到服务
当服务器为一个客户端服务时,而另外的客户端发起了connect,只要服务器listen的队列有空闲的位置,就会为这个新客户端进行连接,并且客户端可以发送数据,但当服务器为这个新客户端服务时,可能一次性把所有数据接收完毕
- 当recv接收数据时,返回值为空,即没有返回数据,那么意味着客户端已经调用了close关闭了;因此服务器通过判断recv接收数据是否为空来判断客户端是否已经下线。
(二)多进程服务器
1 from socket import * 2 from multiprocessing import * 3 from time import sleep 4 5 # 处理客户端的请求并为其服务 6 def dealWithClient(newSocket,destAddr): 7 while True: 8 recvData = newSocket.recv(1024) 9 if len(recvData)>0: 10 print('recv[%s]:%s'%(str(destAddr), recvData)) 11 else: 12 print('[%s]客户端已经关闭'%str(destAddr)) 13 break 14 15 newSocket.close() 16 17 18 def main(): 19 20 serSocket = socket(AF_INET, SOCK_STREAM) 21 serSocket.setsockopt(SOL_SOCKET, SO_REUSEADDR , 1) 22 localAddr = ('', 7788) 23 serSocket.bind(localAddr) 24 serSocket.listen(5) 25 26 try: 27 while True: 28 print('-----主进程,,等待新客户端的到来------') 29 newSocket,destAddr = serSocket.accept() 30 31 print('-----主进程,,接下来创建一个新的进程负责数据处理[%s]-----'%str(destAddr)) 32 client = Process(target=dealWithClient, args=(newSocket,destAddr)) 33 client.start() 34 35 #因为已经向子进程中copy了一份(引用),并且父进程中这个套接字也没有用处了 36 #所以关闭 37 newSocket.close() 38 finally: 39 #当为所有的客户端服务完之后再进行关闭,表示不再接收新的客户端的链接 40 serSocket.close() 41 42 if __name__ == '__main__': 43 main()
总结
- 通过为每个客户端创建一个进程的方式,能够同时为多个客户端进行服务
- 当客户端不是特别多的时候,这种方式还行,如果有几百上千个,就不可取了,因为每次创建进程等过程需要好较大的资源
(三)多线程服务器
1 #coding=utf-8 2 from socket import * 3 from threading import Thread 4 from time import sleep 5 6 # 处理客户端的请求并执行事情 7 def dealWithClient(newSocket,destAddr): 8 while True: 9 recvData = newSocket.recv(1024) 10 if len(recvData)>0: 11 print('recv[%s]:%s'%(str(destAddr), recvData)) 12 else: 13 print('[%s]客户端已经关闭'%str(destAddr)) 14 break 15 16 newSocket.close() 17 18 19 def main(): 20 21 serSocket = socket(AF_INET, SOCK_STREAM) 22 serSocket.setsockopt(SOL_SOCKET, SO_REUSEADDR , 1) 23 localAddr = ('', 7788) 24 serSocket.bind(localAddr) 25 serSocket.listen(5) 26 27 try: 28 while True: 29 print('-----主进程,,等待新客户端的到来------') 30 newSocket,destAddr = serSocket.accept() 31 32 print('-----主进程,,接下来创建一个新的进程负责数据处理[%s]-----'%str(destAddr)) 33 client = Thread(target=dealWithClient, args=(newSocket,destAddr)) 34 client.start() 35 36 #因为线程中共享这个套接字,如果关闭了会导致这个套接字不可用, 37 #但是此时在线程中这个套接字可能还在收数据,因此不能关闭 38 #newSocket.close() 39 finally: 40 serSocket.close() 41 42 if __name__ == '__main__': 43 main()
总结
- 通过为每个客户端创建一个线程的方式,能够同时为多个客户端进行服务
- 并且这种方式比进程占用的资源少
(四)单进程服务器---非堵塞模式
1 from socket import * 2 import time 3 4 # 用来存储所有的新链接的socket 5 g_socketList = [] 6 7 def main(): 8 serSocket = socket(AF_INET, SOCK_STREAM) 9 serSocket.setsockopt(SOL_SOCKET, SO_REUSEADDR , 1) 10 localAddr = ('', 7788) 11 serSocket.bind(localAddr) 12 #可以适当修改listen中的值来看看不同的现象 13 serSocket.listen(1000) 14 #将套接字设置为非堵塞 15 #设置为非堵塞后,如果accept时,恰巧没有客户端connect,那么accept会 16 #产生一个异常,所以需要try来进行处理 17 serSocket.setblocking(False) 18 19 while True: 20 21 #用来测试 22 #time.sleep(0.5) 23 24 try: 25 newClientInfo = serSocket.accept() 26 except Exception as result: 27 pass 28 else: 29 print("一个新的客户端到来:%s"%str(newClientInfo)) 30 newClientInfo[0].setblocking(False) 31 g_socketList.append(newClientInfo) 32 33 # 用来存储需要删除的客户端信息 34 needDelClientInfoList = [] 35 36 for clientSocket,clientAddr in g_socketList: 37 try: 38 recvData = clientSocket.recv(1024) 39 if len(recvData)>0: 40 print('recv[%s]:%s'%(str(clientAddr), recvData)) 41 else: 42 print('[%s]客户端已经关闭'%str(clientAddr)) 43 clientSocket.close() 44 g_needDelClientInfoList.append((clientSocket,clientAddr)) 45 except Exception as result: 46 pass 47 48 for needDelClientInfo in needDelClientInfoList: 49 g_socketList.remove(needDelClientInfo) 50 51 if __name__ == '__main__': 52 main()
(五)单进程服务器---select版
1. select 原理
在多路复用的模型中,比较常用的有select模型和epoll模型。这两个都是系统接口,由操作系统提供。当然,Python的select模块进行了更高级的封装。
网络通信被Unix系统抽象为文件的读写,通常是一个设备,由设备驱动程序提供,驱动可以知道自身的数据是否可用。支持阻塞操作的设备驱动通常会实现一组自身的等待队列,如读/写等待队列用于支持上层(用户层)所需的block或non-block操作。设备的文件的资源如果可用(可读或者可写)则会通知进程,反之则会让进程睡眠,等到数据到来可用的时候,再唤醒进程。
这些设备的文件描述符被放在一个数组中,然后select调用的时候遍历这个数组,如果对应的文件描述符可读则会返回改文件描述符。当遍历结束之后,如果仍然没有一个可用设备文件描述符,select让用户进程则会睡眠,直到等待资源可用的时候在唤醒,遍历之前那个监视的数组。每次遍历都是依次进行判断的。
1 import select 2 import socket 3 import sys 4 5 6 server = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 7 server.bind(('', 7788)) 8 server.listen(5) 9 10 inputs = [server, sys.stdin] 11 12 running = True 13 14 while True: 15 16 # 调用 select 函数,阻塞等待 17 readable, writeable, exceptional = select.select(inputs, [], []) 18 19 # 数据抵达,循环 20 for sock in readable: 21 22 # 监听到有新的连接 23 if sock == server: 24 conn, addr = server.accept() 25 # select 监听的socket 26 inputs.append(conn) 27 28 # 监听到键盘有输入 29 elif sock == sys.stdin: 30 cmd = sys.stdin.readline() 31 running = False 32 break 33 34 # 有数据到达 35 else: 36 # 读取客户端连接发送的数据 37 data = sock.recv(1024) 38 if data: 39 sock.send(data) 40 else: 41 # 移除select监听的socket 42 inputs.remove(sock) 43 sock.close() 44 45 # 如果检测到用户输入敲击键盘,那么就退出 46 if not running: 47 break 48 49 server.close()
总结:
优点
select目前几乎在所有的平台上支持,其良好跨平台支持也是它的一个优点。
缺点
select的一个缺点在于单个进程能够监视的文件描述符的数量存在最大限制,在Linux上一般为1024,可以通过修改宏定义甚至重新编译内核的方式提升这一限制,但是这样也会造成效率的降低。
一般来说这个数目和系统内存关系很大,具体数目可以cat /proc/sys/fs/file-max察看。32位机默认是1024个。64位机默认是2048.
对socket进行扫描时是依次扫描的,即采用轮询的方法,效率较低。
当套接字比较多的时候,每次select()都要通过遍历FD_SETSIZE个Socket来完成调度,不管哪个Socket是活跃的,都遍历一遍。这会浪费很多CPU时间。
(六)单进程服务器---epoll版
1. epoll的优点:
- 没有最大并发连接的限制,能打开的FD(指的是文件描述符,通俗的理解就是套接字对应的数字编号)的上限远大于1024
- 效率提升,不是轮询的方式,不会随着FD数目的增加效率下降。只有活跃可用的FD才会调用callback函数;即epoll最大的优点就在于它只管你“活跃”的连接,而跟连接总数无关,因此在实际的网络环境中,epoll的效率就会远远高于select和poll。
2.说明:
- EPOLLIN (可读)
- EPOLLOUT (可写)
- EPOLLET (ET模式)
epoll对文件描述符的操作有两种模式:LT(level trigger)和ET(edge trigger)。LT模式是默认模式,LT模式与ET模式的区别如下:
LT模式:当epoll检测到描述符事件发生并将此事件通知应用程序,应用程序可以不立即处理该事件。下次调用epoll时,会再次响应应用程序并通知此事件。
ET模式:当epoll检测到描述符事件发生并将此事件通知应用程序,应用程序必须立即处理该事件。如果不处理,下次调用epoll时,不会再次响应应用程序并通知此事件。
1 import socket 2 import select 3 4 # 创建套接字 5 s = socket.socket(socket.AF_INET,socket.SOCK_STREAM) 6 7 # 设置可以重复使用绑定的信息 8 s.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1) 9 10 # 绑定本机信息 11 s.bind(("",7788)) 12 13 # 变为被动 14 s.listen(10) 15 16 # 创建一个epoll对象 17 epoll=select.epoll() 18 19 # 测试,用来打印套接字对应的文件描述符 20 # print s.fileno() 21 # print select.EPOLLIN|select.EPOLLET 22 23 # 注册事件到epoll中 24 # epoll.register(fd[, eventmask]) 25 # 注意,如果fd已经注册过,则会发生异常 26 # 将创建的套接字添加到epoll的事件监听中 27 epoll.register(s.fileno(),select.EPOLLIN|select.EPOLLET) 28 29 30 connections = {} 31 addresses = {} 32 33 # 循环等待客户端的到来或者对方发送数据 34 while True: 35 36 # epoll 进行 fd 扫描的地方 -- 未指定超时时间则为阻塞等待 37 epoll_list=epoll.poll() 38 39 # 对事件进行判断 40 for fd,events in epoll_list: 41 42 # print fd 43 # print events 44 45 # 如果是socket创建的套接字被激活 46 if fd == s.fileno(): 47 conn,addr=s.accept() 48 49 print('有新的客户端到来%s'%str(addr)) 50 51 # 将 conn 和 addr 信息分别保存起来 52 connections[conn.fileno()] = conn 53 addresses[conn.fileno()] = addr 54 55 # 向 epoll 中注册 连接 socket 的 可读 事件 56 epoll.register(conn.fileno(), select.EPOLLIN | select.EPOLLET) 57 58 59 elif events == select.EPOLLIN: 60 # 从激活 fd 上接收 61 recvData = connections[fd].recv(1024) 62 63 if len(recvData)>0: 64 print('recv:%s'%recvData) 65 else: 66 # 从 epoll 中移除该 连接 fd 67 epoll.unregister(fd) 68 69 # server 侧主动关闭该 连接 fd 70 connections[fd].close() 71 72 print("%s---offline---"%str(addresses[fd]))