其实在Linux下设计并发网络程序,向来不缺少方法,比如典型的Apache模型(Process Per Connection,简称PPC),TPC(Thread PerConnection)模型,以及select模型和poll模型,那为何还要再引入Epoll这个东东呢?那还是有得说说的…
1. 常用模型的缺点
如果不摆出来其他模型的缺点,怎么能对比出Epoll的优点呢。
1.1 PPC/TPC模型
这两种模型思想类似,就是让每一个到来的连接一边自己做事去,别再来烦我。只是PPC是为它开了一个进程,而TPC开了一个线程。可是别烦我是有代价的,它要时间和空间啊,连接多了之后,那么多的进程/线程切换,这开销就上来了;因此这类模型能接受的 最大连接数都不会高,一般在几百个左右。
1.2 select模型
1. 最大并发数限制,因为一个进程所打开的FD(文件描述符)是有限制的,由FD_SETSIZE设置,默认值是1024/2048,因此Select模型的最大并发数就被相应限制了。自己改改这个FD_SETSIZE?想法虽好,可是先看看下面吧…
2. 效率问题,select每次调用都会线性扫描全部的FD集合,这样效率就会呈现线性下降,把FD_SETSIZE改大的后果就是,大家都慢慢来,什么?都超时了??!!
3. 内核/用户空间 内存拷贝问题,如何让内核把FD消息通知给用户空间呢?在这个问题上select采取了内存拷贝方法。
1.3 poll模型
基本上效率和select是相同的,select缺点的2和3它都没有改掉。
2. Epoll的提升
把其他模型逐个批判了一下,再来看看Epoll的改进之处吧,其实把select的缺点反过来那就是Epoll的优点了。
2.1. Epoll没有最大并发连接的限制,上限是最大可以打开文件的数目,这个数字一般远大于2048, 一般来说这个数目和系统内存关系很大,具体数目可以cat /proc/sys/fs/file-max察看。
2.2. 效率提升,Epoll最大的优点就在于它只管你“活跃”的连接,而跟连接总数无关,因此在实际的网络环境中,Epoll的效率就会远远高于select和poll。
2.3. 内存拷贝,Epoll在这点上使用了“共享内存”,这个内存拷贝也省略了。
3. Epoll为什么高效
Epoll的高效和其数据结构的设计是密不可分的,这个下面就会提到。
首先回忆一下select模型,当有I/O事件到来时,select通知应用程序有事件到了快去处理,而应用程序必须轮询所有的FD集合,测试每个FD是否有事件发生,并处理事件;代码像下面这样:
int res = select(maxfd+1, &readfds, NULL, NULL, 120); if(res > 0) { for(int i = 0; i < MAX_CONNECTION; i++) { if(FD_ISSET(allConnection[i],&readfds)) { handleEvent(allConnection[i]); } } } // if(res == 0) handle timeout, res < 0 handle error
Epoll不仅会告诉应用程序有I/0事件到来,还会告诉应用程序相关的信息,这些信息是应用程序填充的,因此根据这些信息应用程序就能直接定位到事件,而不必遍历整个FD集合。
int res = epoll_wait(epfd, events, 20, 120); for(int i = 0; i < res;i++) { handleEvent(events[n]); }
4. Epoll关键数据结构
前面提到Epoll速度快和其数据结构密不可分,其关键数据结构就是:
struct epoll_event { __uint32_t events; // Epoll events epoll_data_t data; // User datavariable }; typedef union epoll_data { void *ptr; int fd; __uint32_t u32; __uint64_t u64; } epoll_data_t;
可见epoll_data是一个union结构体,借助于它应用程序可以保存很多类型的信息:fd、指针等等。有了它,应用程序就可以直接定位目标了。
5. 使用Epoll
epoll的使用主要在于三个函数。
1. epoll_create(int size);
创建一个epoll的句柄,size用来告诉内核这个监听的数目最大值。 注意!是数量的最大值,不是fd的最大值,切勿搞混。 当创建好epoll句柄后,它就是会占用一个fd值,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。
2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注册函数。 epfd是epoll的句柄,即epoll_create的返回值; op表示动作:用三个宏表示: EPOLL_CTL_ADD:注册新的fd到epfd中; EPOLL_CTL_MOD:修改已经注册的fd的监听事件; EPOLL_CTL_DEL:从epfd中删除一个fd; fd是需要监听的套接字描述符; event是设定监听事件的结构体,数据结构如下:
typedef union epoll_data { void *ptr; int fd; __uint32_t u32; __uint64_t u64 }epoll_data_t; struct epoll_event { __uint32_t events; /* Epoll events */ epoll_data_t data; /* User data variable */ };
events可以是以下几个宏的集合:
EPOLLIN :表示对应的文件描述符可以读(包括对端SOCKET正常关闭);
EPOLLOUT:表示对应的文件描述符可以写;
EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);
EPOLLERR:表示对应的文件描述符发生错误; EPOLLHUP:表示对应的文件描述符被挂断;
EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。
EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,就会把这个fd从epoll的队列中删除。
如果还需要继续监听这个socket的话,需要再次把这个fd加入到EPOLL队列里
3. int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
等待事件的产生,返回需要处理的事件的数量,并将需处理事件的套接字集合于参数events内,可以遍历events来处理事件。
参数epfd为epoll句柄 events为事件集合 参数timeout是超时时间(毫秒,0会立即返回,-1是永久阻塞)。
该函数返回需要处理的事件数目,如返回0表示已超时。
4.使用实例
1 #include <sys/socket.h> 2 #include <sys/epoll.h> 3 #include <netinet/in.h> 4 #include <arpa/inet.h> 5 #include <fcntl.h> 6 #include <unistd.h> 7 #include <stdio.h> 8 #include <errno.h> 9 #include <stdlib.h> 10 #include <string.h> 11 12 #define MAXLINE 10 //最大长度 13 #define OPEN_MAX 100 14 #define LISTENQ 20 15 #define SERV_PORT 8000 16 #define INFTIM 1000 17 #define IP_ADDR "10.73.219.151" 18 19 int main() 20 { 21 struct epoll_event ev, events[20]; 22 struct sockaddr_in clientaddr, serveraddr; 23 int epfd; 24 int listenfd;//监听fd 25 int maxi; 26 int nfds; 27 int i; 28 int sock_fd, conn_fd; 29 char buf[MAXLINE]; 30 31 epfd = epoll_create(256);//生成epoll句柄 32 listenfd = socket(AF_INET, SOCK_STREAM, 0);//创建套接字 33 ev.data.fd = listenfd;//设置与要处理事件相关的文件描述符 34 ev.events = EPOLLIN;//设置要处理的事件类型 35 36 epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev);//注册epoll事件 37 38 memset(&serveraddr, 0, sizeof(serveraddr)); 39 serveraddr.sin_family = AF_INET; 40 serveraddr.sin_addr.s_addr = htonl(INADDR_ANY); 41 serveraddr.sin_port = htons(SERV_PORT); 42 bind(listenfd,(struct sockaddr*)&serveraddr, sizeof(serveraddr));//绑定套接口 43 socklen_t clilen; 44 listen(listenfd, LISTENQ);//转为监听套接字 45 int n; 46 while(1) 47 { 48 nfds = epoll_wait(epfd,events,20,500);//等待事件发生 49 //处理所发生的所有事件 50 for(i=0;i<nfds;i++) 51 { 52 if(events[i].data.fd == listenfd)//有新的连接 53 { 54 clilen = sizeof(struct sockaddr_in); 55 conn_fd = accept(listenfd, (struct sockaddr*)&clientaddr, &clilen); 56 printf("accept a new client : %s\n",inet_ntoa(clientaddr.sin_addr)); 57 ev.data.fd = conn_fd; 58 ev.events = EPOLLIN;//设置监听事件为可写 59 epoll_ctl(epfd, EPOLL_CTL_ADD, conn_fd, &ev);//新增套接字 60 } 61 else if(events[i].events & EPOLLIN)//可读事件 62 { 63 if((sock_fd = events[i].data.fd) < 0) 64 continue; 65 if((n = recv(sock_fd, buf, MAXLINE, 0)) < 0) 66 { 67 if(errno == ECONNRESET) 68 { 69 close(sock_fd); 70 events[i].data.fd = -1; 71 } 72 else 73 { 74 printf("readline error\n"); 75 } 76 } 77 else if(n == 0) 78 { 79 close(sock_fd); 80 printf("关闭\n"); 81 events[i].data.fd = -1; 82 } 83 84 printf("%d -- > %s\n",sock_fd, buf); 85 ev.data.fd = sock_fd; 86 ev.events = EPOLLOUT; 87 epoll_ctl(epfd,EPOLL_CTL_MOD,sock_fd,&ev);//修改监听事件为可读 88 } 89 90 else if(events[i].events & EPOLLOUT)//可写事件 91 { 92 sock_fd = events[i].data.fd; 93 printf("OUT\n"); 94 scanf("%s",buf); 95 send(sock_fd, buf, MAXLINE, 0); 96 97 ev.data.fd = sock_fd; 98 ev.events = EPOLLIN; 99 epoll_ctl(epfd, EPOLL_CTL_MOD,sock_fd, &ev); 100 } 101 } 102 } 103 104 return 0; 105 }