epoll函数

epoll介绍

本质是一个红黑树,epfd是红黑树的根,然后挂子节点

epoll所需函数

int eopll_create(int size)

size:创建的红黑树的监听节点数量。(仅供内核参考)
返回值:指向新创建的新红黑数的根节点epfd,失败就-1

int eopll_ctl(int epfd, int op, int fd, struct epoll_event *event)

操作红黑树
epfd:红黑树的根节点,epoll_create的返回值
op:对该监听所做的操作,节点挂在树上,和摘下,还有修改。

  • EPOLL_CTL_ADD: 添加fd到红黑树
  • EPOLL_CTL_MOD: 修改fd在红黑树上的监听事件
  • EPOLL_CTL_DEL: 将fd从红黑树上摘除(取消监听)

fd:待监听的fd
event:一个结构体,不是数组,注意和poll区分
image
返回值:成功0,失败-1

int eopll_wait(int epid, struct epoll_event *events, int maxevents, int timeout)

注意这是阻塞监听
epfd:红黑树根节点
events:注意和creat函数中的不一样,这里面有s,所以这个是一个数组,典型的传出参数,传出满足监听条件的fd结构体
maxevents:数组 元素的总个数 不是实际监听的

  • struct epoll_event events[1024];传1024

timeout:-1阻塞,0是非阻塞,>0超时时间
返回值

  • 大于0,满足监听的总个数,可以用作数组下标用作循环上限
  • 0没有满足监听事件
  • 小于0,错误

使用上面函数实现EPOLL多路IO转接

/*************************************************************************
	> File Name: server.c
	> Author: shaozheming
	> Mail: 957510530@qq.com
	> Created Time: 2022年03月05日 星期六 10时48分07秒
 ************************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>
#include <ctype.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <sys/epoll.h>
#include <errno.h>

#include "wrap.h"

#define SERV_PORT 6666
#define MAXLINE 8192
#define OPEN_MAX 5000
#define INET_ADDRSTRLEN 16

int main(int argc, char* argv[])
{
    int i, listenfd, connfd, sockfd;
	int n, num = 0;
	ssize_t nready, efd, res;
	char buf[MAXLINE], str[INET_ADDRSTRLEN];
	socklen_t clilen;

	struct sockaddr_in cliaddr, servaddr;
	struct epoll_event tep, ep[OPEN_MAX]; //tep是ctl参数,ep为wait参数

	listenfd = Socket(AF_INET, SOCK_STREAM, 0);
	
	/* 端口复用 */
	int opt = 1;
	setsockopt(listenfd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));

	/* 服务器地址设置 */
	bzero(&servaddr, sizeof(servaddr));
	servaddr.sin_family = AF_INET;
	servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
	servaddr.sin_port = htons(SERV_PORT);

	/* 绑定 */
	Bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
	/* 监听设置 */
	Listen(listenfd, 20);

	/* 创建epoll模型 */
	efd = epoll_create(OPEN_MAX); //创建一个5000个节点的红黑树,efd是红黑树的根
	if(efd == -1) perr_exit("epoll create error!\r\n");
	
	/* 绑定listenfd的监听事件为读 */
	tep.events = EPOLLIN;
	tep.data.fd = listenfd;
	res = epoll_ctl(efd, EPOLL_CTL_ADD, listenfd, &tep); //将lfd和对应的结构体挂载红黑树上
	if(res == -1) perr_exit("epoll ctrl error!\r\n");

	while(1) {
		/* 阻塞监听事件,ep为传出参数的数组 */
		nready = epoll_wait(efd, ep, OPEN_MAX, -1);
		if(nready == -1) perr_exit("epoll wait error!\r\n");

		for(i = 0; i < nready; ++i) {
			if(!(ep[i].events & EPOLLIN))
				continue; //如果不是读事件,继续循环

			if(ep[i].data.fd == listenfd) { //lfd就是有连接请求
				clilen = sizeof(cliaddr);
				connfd = Accept(listenfd, (struct sockaddr *)&cliaddr, &clilen);

				printf("received from %s at PORT %d\n", 
						inet_ntop(AF_INET, &cliaddr.sin_addr, str, sizeof(str)),
						ntohs(cliaddr.sin_port));
				printf("cfd %d---client %d\n", connfd, ++num);

				/* 将连接节点加入红黑树 */
				tep.events = EPOLLIN;
				tep.data.fd = connfd;
				res = epoll_ctl(efd, EPOLL_CTL_ADD, connfd, &tep);
				if(res == -1) perr_exit("epoll ctrl error!\r\n");
			} else { //不是连接事件,就是建立socket通信
				sockfd = ep[i].data.fd;
				n = Read(sockfd, buf, MAXLINE);

				if(n == 0) {
					/* 客户端关闭链接 */
					res = epoll_ctl(efd, EPOLL_CTL_DEL, sockfd, NULL); //将关闭链接的文件描述符摘除
					if(res == -1) perr_exit("epoll ctrl error!\r\n");
					Close(sockfd);
					--num;
					printf("client[%d] closed connection\n", sockfd);
				} else if (n < 0) {
					/* 出错 */
					perror("read n < 0 error: ");
					res = epoll_ctl(efd, EPOLL_CTL_DEL, sockfd, NULL);
					Close(sockfd);
					--num; //num用于记录连接客户端的个数,失败了会减小
				} else {
					/* 连接成功并有通信数据 */
					for(i = 0; i < n; ++i) {
						buf[i] = toupper(buf[i]);
					}
					Write(STDOUT_FILENO, buf, n);
					Writen(sockfd, buf, n);
				}
			}
		}
	}
	Close(listenfd);

	return 0;
}

网络的ET和LT模式

Edge Triggered【ET】边缘触发只有数据到来才触发,不管缓存中是否还有数据
Level Triggered【LT】水平触发,只要有数据都会触发

/*************************************************************************
	> File Name: server.c
	> Author: shaozheming
	> Mail: 957510530@qq.com
	> Created Time: 2022年03月05日 星期六 10时48分07秒
 ************************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>
#include <ctype.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <sys/epoll.h>
#include <errno.h>

#include "wrap.h"

#define MAXLINE 10

int main(int argc, char* argv[])
{
	int efd, i;
	int pfd[2]; //管道
	pid_t pid;
	char buf[MAXLINE], ch = 'a';

	pipe(pfd);
	pid = fork();

	if(pid == 0) { 
		/* 子进程写 */
		close(pfd[0]); //关闭读端
		while(1) {
			//aaaa\n
			for(i = 0; i < MAXLINE/2; ++i)
				buf[i] = ch;
			buf[i-1] = '\n';
			ch++;
			//bbbb\n
			for(; i < MAXLINE; ++i)
				buf[i] = ch;
			buf[i-1] = '\n';
			ch++;
			write(pfd[1], buf, sizeof(buf));
			sleep(5);
		}
		close(pfd[1]);
	} else if(pid > 0) {
		/* 父进程读 */
		struct epoll_event event;
		struct epoll_event resevent[10];
		int res, len;

		close(pfd[1]); //关闭写端
		efd = epoll_create(10);
		
//		event.events = EPOLLIN | EPOLLET; //ET边沿触发
		event.events = EPOLLIN; //默认LT水平触发
		event.data.fd = pfd[0];
		epoll_ctl(efd, EPOLL_CTL_ADD, pfd[0], &event);

		while(1) {
			res = epoll_wait(efd, resevent, 10, -1);
			printf("res = %d\r\n", res);
			if(resevent[0].data.fd == pfd[0]) {
				len = Readn(pfd[0], buf, MAXLINE/2);
				write(STDOUT_FILENO, buf, len);
			}
		}

		close(pfd[0]);
		close(efd);
	} else {
	
		perror("fork error!\r\n");
		exit(-1);
	}
	return 0;
}

ET模式下必须使用非阻塞

阻塞IO:当你去读一个阻塞的文件描述符时,如果在该文件描述符上没有数据可读,那么它会一直阻塞(通俗一点就是一直卡在调用函数那里),直到有数据可读。当你去写一个阻塞的文件描述符时,如果在该文件描述符上没有空间(通常是缓冲区)可写,那么它会一直阻塞,直到有空间可写。以上的读和写我们统一指在某个文件描述符进行的操作,不单单指真正的读数据,写数据,还包括接收连接accept(),发起连接connect()等操作…
非阻塞IO:当你去读写一个非阻塞的文件描述符时,不管可不可以读写,它都会立即返回,返回成功说明读写操作完成了,返回失败会设置相应errno状态码,根据这个errno可以进一步执行其他处理。它不会像阻塞IO那样,卡在那里不动!!!
Level_triggered(水平触发):当被监控的文件描述符上有可读写事件发生时,epoll_wait()会通知处理程序去读写。如果这次没有把数据一次性全部读写完(如读写缓冲区太小),那么下次调用 epoll_wait()时,它还会通知你在上没读写完的文件描述符上继续读写,当然如果你一直不去读写,它会一直通知你!!!如果系统中有大量你不需要读写的就绪文件描述符,而它们每次都会返回,这样会大大降低处理程序检索自己关心的就绪文件描述符的效率!!!
Edge_triggered(边缘触发):当被监控的文件描述符上有可读写事件发生时,epoll_wait()会通知处理程序去读写。如果这次没有把数据全部读写完(如读写缓冲区太小),那么下次调用epoll_wait()时,它不会通知你,也就是它只会通知你一次,直到该文件描述符上出现第二次可读写事件才会通知你!!!这种模式比水平触发效率高,系统不会充斥大量你不关心的就绪文件描述符!!!
所以ET所以循环处理,保证能将数据读取完毕,即同时要保证非阻塞IO,不然最后会被阻塞

epoll反应堆

ET模式+非阻塞轮询+void * ptr
image
再来看这张图中的ptr,因为是void*,可以进行类型转换和回调,操作空间变大,一般搭配监听写事件的回调函数
image

/*************************************************************************
	> File Name: server.c
	> Author: shaozheming
	> Mail: 957510530@qq.com
	> Created Time: 2022年03月07日 星期一 14时24分00秒
 ************************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>
#include <ctype.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <sys/epoll.h>
#include <errno.h>
#include <sys/epoll.h>
#include <fcntl.h>
#include <time.h>

#include "wrap.h"

#define MAX_EVENTS 1024     /* 监听上限 */
#define SERV_PORT 6666
#define BUFLEN 4096

void recvdata(int fd, int events, void *arg);
void senddata(int fd, int events, void *arg);

struct myevent_s {
	int fd;												/* 要监听的文件描述符 */
	int events;											/* 对应的监听事件 */
	void *arg;											/* 泛型参数 */
	void (*call_back)(int fd, int events, void *arg);   /* 回调函数 */
	int status;											/* 是否在监听,1:在红黑树上 0:不再红黑树上 */
	char buf[BUFLEN];									/* 缓冲区 */
	int len;											/* 缓冲区大小 */
	long last_active;									/* 记录每次加入红黑树 g_efd的时间值, 时间太长就剔除 */
};

int g_efd;												/* 全局变量,保存红黑树的根节点 */
struct myevent_s g_events[MAX_EVENTS + 1];				/* 自定义结构体数组,1025个还有listenfd */

/* 结构体myevent_s成员变量初始化 */
void eventset(struct myevent_s *ev, int fd, void (*call_back)(int, int, void *), void *arg)
{
	ev->fd = fd;
	ev->call_back = call_back;
	ev->events = 0; 
	ev->arg = arg;
	ev->status = 0;
	memset(ev->buf, 0, sizeof(ev->buf));
	ev->len = 0;
	ev->last_active = time(NULL);  //当前时间,即调用eventset函数的时间

	return;
}

/* 向epoll监听的红黑树添加一个文件描述符 */
void eventadd(int efd, int events, struct myevent_s *ev)
{
	struct epoll_event epv = {0, {0}};
	int op;
	epv.data.ptr = ev;
	epv.events = ev->events = events;		//两个结构体都要赋值

	if(ev->status == 0) { //没有挂在红黑树上要挂一下
		op = EPOLL_CTL_ADD;
		ev->status = 1; //加入红黑树并将状态置1
	}

	if(epoll_ctl(efd, op, ev->fd, &epv) < 0)
		printf("event add failed [fd = %d], events[%d]\r\n", ev->fd, events);
	else
		printf("event add ok [fd = %d], op = %d, events[%d]\r\n", ev->fd,op, events);

	return;
}

/* 从监听的红黑树中删除一个文件描述符 */
void eventdel(int efd, struct myevent_s *ev)
{
	struct epoll_event epv = {0, {0}};

	if(ev->status != 1)
		return ;

	epv.data.ptr = NULL;
	ev->status = 0;
	epoll_ctl(efd, EPOLL_CTL_DEL, ev->fd, &epv);

	return ;
}

/* 调用该函数与客户端进行连接 */
void acceptconn(int lfd, int events, void *arg)
{
	struct sockaddr_in cin;
	socklen_t len = sizeof(cin);
	int cfd, i;

	if((cfd = accept(lfd, (struct sockaddr *)&cin, &len)) == -1) {
		if(errno != EAGAIN && errno != EINTR) {
			/* 暂时不做处理 */
		}
		printf("%s: accept, %s\n", __func__, strerror(errno));
		return ;
	}

	do {
		for (i = 0; i < MAX_EVENTS; ++i) 
			if(g_events[i].status == 0) break;			//从数组中找到一个空闲元素,找到就跳出

		if(i == MAX_EVENTS) {
			printf("%s: max connect limit[%s]\n", __func__, strerror(errno));
			break; //没有空闲的了
		}

		int flag = 0;
		if((flag - fcntl(cfd, F_SETFL, O_NONBLOCK)) < 0) {
			/* 设置为非阻塞 */
			printf("%s: fcntl nonblocking failed, %s\n", __func__, strerror(errno));
			break;
		}

		/* 给cfd设置一个myevent_s结构体,回调函数设置为recvdata */
		eventset(&g_events[i], cfd, recvdata, &g_events[i]);
		eventadd(g_efd, EPOLLIN, &g_events[i]);
	}while(0);

	printf("new connect [%s:%d][time:%ld], pos[%d]\n", 
			inet_ntoa(cin.sin_addr), ntohs(cin.sin_port), g_events[i].last_active, i);

	return ;
}

void recvdata(int fd, int events, void *arg)
{
	struct myevent_s *ev = (struct myevent_s *)arg;
	int len;

	len = recv(fd, ev->buf, sizeof(ev->buf), 0);  //读文件描述符并存入

	eventdel(g_efd, ev);

	if(len > 0) {
		
		ev->len = len;
		ev->buf[len] = '\0';
		printf("C[%d]:%s\n",fd, ev->buf);

		eventset(ev, fd, senddata, ev);  //设置回调会senddata
		eventadd(g_efd, EPOLLOUT, ev); //监听写事件
	} else if(len == 0) {
		close(ev->fd);
		/* 相减得到元素偏离位置 */
		printf("[fd = %d] pos[%ld], closed!\r\n", fd, ev - g_events);
	} else {
		close(ev->fd);
		printf("recv[fd = %d] error %s\r\n", fd, strerror(errno));
	}
}

/* 发送数据 */
void senddata(int fd, int events, void *arg)
{
	struct myevent_s *ev = (struct myevent_s*) arg;
	int len;

	len = send(fd, ev->buf, ev->len, 0);

	eventdel(g_efd, ev);

	if(len > 0) {
		printf("send[fd = %d], [%d]%s\r\n", fd, len, ev->buf);
		eventset(ev, fd, recvdata, ev); //写完之后再次挂到红黑树上,变成读
		eventadd(g_efd, EPOLLIN, ev);
	} else {
		close(ev->fd);
		printf("send[fd = %d] error %s\r\n", fd, strerror(errno));
	}

	return ;
}

/* 创建socket, 初始化lfd */
void initlistensocket(int efd, short port)
{
	struct sockaddr_in sin;

	int lfd = socket(AF_INET, SOCK_STREAM, 0);
	fcntl(lfd, F_SETFL, O_NONBLOCK);

	memset(&sin, 0, sizeof(sin));
	sin.sin_family = AF_INET;
	sin.sin_addr.s_addr = INADDR_ANY;
	sin.sin_port = htons(port);

	bind(lfd, (struct sockaddr *)&sin, sizeof(sin));

	listen(lfd, 20);

	eventset(&g_events[MAX_EVENTS], lfd, acceptconn, &g_events[MAX_EVENTS]);
	eventadd(efd, EPOLLIN, &g_events[MAX_EVENTS]);

	return ;
}

int main(int argc, char* argv[])
{
	unsigned short port = SERV_PORT;
	if(argc == 2)
		port = atoi(argv[1]);    //使用用户指定端口,如未指定,用默认端口
	
	g_efd = epoll_create(MAX_EVENTS + 1); //创建红黑树
	if(g_efd <= 0)
		printf("create efd in %s err %s \r\n", __func__, strerror(errno));

	initlistensocket(g_efd, port);       //初始化监听socket

	struct epoll_event events[MAX_EVENTS+1]; //保存已满足就绪事件的文件描述符数组,再epoll_wait
	printf("server running:port[%d]\n", port);

	int checkpos = 0, i;

	while(1) {
		/* 超时验证,每次测试100个链接,不测试listenfd,当客户端60s内没有和服务器通信则关闭 */

		long now = time(NULL);				//当前时间
		for(i = 0; i < 100; ++i, ++checkpos) {
			/* 一次循环检测100个,使用checkpos控制检测对象 */
			if(checkpos == MAX_EVENTS)
				checkpos = 0;
			if(g_events[checkpos].status != 1)  /* 不在红黑树上 */
				continue;

			long duration = now - g_events[checkpos].last_active; //客户端不活跃的时间
			if(duration > 60) {
				close(g_events[checkpos].fd);
				printf("[fd = %d] timeout\n", g_events[checkpos].fd);
				eventdel(g_efd, &g_events[checkpos]);
			}
		}

		/* 监听红黑树g_efd, 将满足的事件的文件描述符加至events数组中,1秒没有事件满足,返回0 */
		int nfd = epoll_wait(g_efd, events, MAX_EVENTS + 1, 1000);
		if(nfd < 0) {
			printf("epoll_wait error, exit\n");
			break;
		}

		for(i = 0; i < nfd; ++i) {
			/* 使用自定义结构体指针,接受ptr成员 */
			struct myevent_s *ev = (struct myevent_s *)events[i].data.ptr;

			if((events[i].events & EPOLLIN) && (ev->events & EPOLLIN)) {
				ev->call_back(ev->fd, events[i].events, ev->arg); //读就绪
			}

			if((events[i].events & EPOLLOUT) && (ev->events & EPOLLOUT)) {
				ev->call_back(ev->fd, events[i].events, ev->arg); //写就绪
			}
		}
	}

	return 0;
}
posted @ 2022-03-06 13:04  蘑菇王国大聪明  阅读(129)  评论(0编辑  收藏  举报