Linux Epoll相关知识

其实在Linux下设计并发网络程序，向来不缺少方法，比如典型的Apache模型（Process Per Connection，简称PPC），TPC（Thread PerConnection）模型，以及select模型和poll模型，那为何还要再引入Epoll这个东东呢？那还是有得说说的…

1. 常用模型的缺点

　　如果不摆出来其他模型的缺点，怎么能对比出Epoll的优点呢。

1.1 PPC/TPC模型

　　这两种模型思想类似，就是让每一个到来的连接一边自己做事去，别再来烦我。只是PPC是为它开了一个进程，而TPC开了一个线程。可是别烦我是有代价的，它要时间和空间啊，连接多了之后，那么多的进程/线程切换，这开销就上来了；因此这类模型能接受的　　最大连接数都不会高，一般在几百个左右。

1.2 select模型

　　1. 最大并发数限制，因为一个进程所打开的FD（文件描述符）是有限制的，由FD_SETSIZE设置，默认值是1024/2048，因此Select模型的最大并发数就被相应限制了。自己改改这个FD_SETSIZE？想法虽好，可是先看看下面吧…

　　2. 效率问题，select每次调用都会线性扫描全部的FD集合，这样效率就会呈现线性下降，把FD_SETSIZE改大的后果就是，大家都慢慢来，什么？都超时了？？！！

　　3. 内核/用户空间内存拷贝问题，如何让内核把FD消息通知给用户空间呢？在这个问题上select采取了内存拷贝方法。

1.3 poll模型

　　基本上效率和select是相同的，select缺点的2和3它都没有改掉。

2. Epoll的提升

　　把其他模型逐个批判了一下，再来看看Epoll的改进之处吧，其实把select的缺点反过来那就是Epoll的优点了。

　　2.1. Epoll没有最大并发连接的限制，上限是最大可以打开文件的数目，这个数字一般远大于2048, 一般来说这个数目和系统内存关系很大，具体数目可以cat /proc/sys/fs/file-max察看。

　　2.2. 效率提升，Epoll最大的优点就在于它只管你“活跃”的连接，而跟连接总数无关，因此在实际的网络环境中，Epoll的效率就会远远高于select和poll。

　　2.3. 内存拷贝，Epoll在这点上使用了“共享内存”，这个内存拷贝也省略了。

3. Epoll为什么高效

　　Epoll的高效和其数据结构的设计是密不可分的，这个下面就会提到。

　　首先回忆一下select模型，当有I/O事件到来时，select通知应用程序有事件到了快去处理，而应用程序必须轮询所有的FD集合，测试每个FD是否有事件发生，并处理事件；代码像下面这样：

int res = select(maxfd+1, &readfds, NULL, NULL, 120);

if(res > 0)

{

    for(int i = 0; i < MAX_CONNECTION; i++)

    {

        if(FD_ISSET(allConnection[i],&readfds))

        {

            handleEvent(allConnection[i]);

        }

    }

}

// if(res == 0) handle timeout, res < 0 handle error

Epoll不仅会告诉应用程序有I/0事件到来，还会告诉应用程序相关的信息，这些信息是应用程序填充的，因此根据这些信息应用程序就能直接定位到事件，而不必遍历整个FD集合。

int res = epoll_wait(epfd, events, 20, 120);

for(int i = 0; i < res;i++)

{

    handleEvent(events[n]);

}

4. Epoll关键数据结构

　　前面提到Epoll速度快和其数据结构密不可分，其关键数据结构就是：

struct epoll_event {

    __uint32_t events;      // Epoll events

    epoll_data_t data;      // User datavariable

};

typedef union epoll_data {

    void *ptr;

   int fd;

    __uint32_t u32;

    __uint64_t u64;

} epoll_data_t;

　　可见epoll_data是一个union结构体,借助于它应用程序可以保存很多类型的信息:fd、指针等等。有了它，应用程序就可以直接定位目标了。

5. 使用Epoll

　　epoll的使用主要在于三个函数。

　　1. epoll_create(int size);

　　创建一个epoll的句柄，size用来告诉内核这个监听的数目最大值。注意!是数量的最大值，不是fd的最大值，切勿搞混。当创建好epoll句柄后，它就是会占用一个fd值，所以在使用完epoll后，必须调用close()关闭，否则可能导致fd被耗尽。

　　2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

　　epoll的事件注册函数。 epfd是epoll的句柄，即epoll_create的返回值； op表示动作：用三个宏表示： EPOLL_CTL_ADD：注册新的fd到epfd中； EPOLL_CTL_MOD：修改已经注册的fd的监听事件； EPOLL_CTL_DEL：从epfd中删除一个fd； fd是需要监听的套接字描述符； event是设定监听事件的结构体，数据结构如下：

typedef union epoll_data
{
    void *ptr;
    int fd;
    __uint32_t u32;
    __uint64_t u64
}epoll_data_t;
struct epoll_event 
{
  __uint32_t events;  /* Epoll events */
  epoll_data_t data;  /* User data variable */
};
events可以是以下几个宏的集合： 
EPOLLIN ：表示对应的文件描述符可以读（包括对端SOCKET正常关闭）； 
EPOLLOUT：表示对应的文件描述符可以写； 
EPOLLPRI：表示对应的文件描述符有紧急的数据可读（这里应该表示有带外数据到来）； 
EPOLLERR：表示对应的文件描述符发生错误； EPOLLHUP：表示对应的文件描述符被挂断； 
EPOLLET： 将EPOLL设为边缘触发(Edge Triggered)模式，这是相对于水平触发(Level Triggered)来说的。 
EPOLLONESHOT：只监听一次事件，当监听完这次事件之后，就会把这个fd从epoll的队列中删除。 
如果还需要继续监听这个socket的话，需要再次把这个fd加入到EPOLL队列里

　　3. int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

　　等待事件的产生，返回需要处理的事件的数量，并将需处理事件的套接字集合于参数events内，可以遍历events来处理事件。

　　参数epfd为epoll句柄 events为事件集合参数timeout是超时时间（毫秒，0会立即返回，-1是永久阻塞）。

　　该函数返回需要处理的事件数目，如返回0表示已超时。

　　4.使用实例

  1 #include <sys/socket.h>
  2 #include <sys/epoll.h>
  3 #include <netinet/in.h>
  4 #include <arpa/inet.h>
  5 #include <fcntl.h>
  6 #include <unistd.h>
  7 #include <stdio.h>
  8 #include <errno.h>
  9 #include <stdlib.h>
 10 #include <string.h>
 11 
 12 #define MAXLINE 10   //最大长度
 13 #define OPEN_MAX 100
 14 #define LISTENQ 20
 15 #define SERV_PORT 8000
 16 #define INFTIM 1000
 17 #define IP_ADDR "10.73.219.151"
 18 
 19 int main()
 20 {
 21     struct epoll_event ev, events[20];
 22     struct sockaddr_in clientaddr, serveraddr;
 23     int epfd;
 24     int listenfd;//监听fd
 25     int maxi;
 26     int nfds;
 27     int i;
 28     int sock_fd, conn_fd;
 29     char buf[MAXLINE];
 30 
 31     epfd = epoll_create(256);//生成epoll句柄
 32     listenfd = socket(AF_INET, SOCK_STREAM, 0);//创建套接字
 33     ev.data.fd = listenfd;//设置与要处理事件相关的文件描述符
 34     ev.events = EPOLLIN;//设置要处理的事件类型
 35 
 36     epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev);//注册epoll事件
 37 
 38     memset(&serveraddr, 0, sizeof(serveraddr));
 39     serveraddr.sin_family = AF_INET;
 40     serveraddr.sin_addr.s_addr = htonl(INADDR_ANY);
 41     serveraddr.sin_port = htons(SERV_PORT);
 42     bind(listenfd,(struct sockaddr*)&serveraddr, sizeof(serveraddr));//绑定套接口
 43     socklen_t clilen;
 44     listen(listenfd, LISTENQ);//转为监听套接字
 45     int n;
 46     while(1)
 47     {
 48         nfds = epoll_wait(epfd,events,20,500);//等待事件发生
 49         //处理所发生的所有事件
 50         for(i=0;i<nfds;i++)
 51         {
 52             if(events[i].data.fd == listenfd)//有新的连接
 53             {
 54                 clilen = sizeof(struct sockaddr_in);
 55                 conn_fd = accept(listenfd, (struct sockaddr*)&clientaddr, &clilen);
 56                 printf("accept a new client : %s\n",inet_ntoa(clientaddr.sin_addr));
 57                 ev.data.fd = conn_fd;
 58                 ev.events = EPOLLIN;//设置监听事件为可写
 59                 epoll_ctl(epfd, EPOLL_CTL_ADD, conn_fd, &ev);//新增套接字
 60             }
 61             else if(events[i].events & EPOLLIN)//可读事件
 62             {
 63                 if((sock_fd = events[i].data.fd) < 0)
 64                     continue;
 65                 if((n = recv(sock_fd, buf, MAXLINE, 0)) < 0)
 66                 {
 67                     if(errno == ECONNRESET)
 68                     {
 69                         close(sock_fd);
 70                         events[i].data.fd = -1;
 71                     }
 72                     else
 73                     {
 74                         printf("readline error\n");
 75                     }
 76                 }
 77                 else if(n == 0)
 78                 {
 79                     close(sock_fd);
 80                     printf("关闭\n");
 81                     events[i].data.fd = -1;
 82                 }
 83 
 84                 printf("%d -- > %s\n",sock_fd, buf);
 85                 ev.data.fd = sock_fd;
 86                 ev.events = EPOLLOUT;
 87                 epoll_ctl(epfd,EPOLL_CTL_MOD,sock_fd,&ev);//修改监听事件为可读
 88             }
 89 
 90             else if(events[i].events & EPOLLOUT)//可写事件
 91             {
 92                 sock_fd = events[i].data.fd;
 93                 printf("OUT\n");
 94                 scanf("%s",buf);
 95                 send(sock_fd, buf, MAXLINE, 0);
 96 
 97                 ev.data.fd = sock_fd;
 98                 ev.events = EPOLLIN;
 99                 epoll_ctl(epfd, EPOLL_CTL_MOD,sock_fd, &ev);
100             }
101         }
102     }
103 
104     return 0;   
105 }

posted on 2016-11-28 16:25 午夜稻草人阅读(274) 评论(0) 编辑收藏举报

刷新页面返回顶部

午夜稻草人

公告