TCP/IP网络编程之I/O复用
基于I/O复用的服务端
在前面章节的学习中,我们看到了当有新的客户端请求时,服务端进程会创建一个子进程,用于处理和客户端的连接和处理客户端的请求。这是一种并发处理客户端请求的方案,但并不是一个很好的方案,因为创建进程时需要付出很大的代价,需要大量的运算和内存空间,由于每个进程都具有独立的内存空间,所以相互间的数据交换也要求采用相对复杂的方法(IPC属于相对复杂的通信方法)
那么有没有其他的方案可以在不创建子进程的前提下可以并发处理客户端请求?当然是有的,那就是I/O复用技术了。I/O多路复用是通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作
理解select函数并实现服务端
select函数可以将多个文件描述符集中到一起统一监视,具体监视的“事件”如下:
- 是否存在套接字接收数据?
- 无需阻塞传输数据的套接字有哪些?
- 哪些套接字发生异常?
上述的三种监视项可以称为“事件”,发生监视项对应的情况时,称“事件发生”。接下来,我们介绍一下select函数的调用方法和顺序,如图
如图1-1 select函数调用过程
图1-1给出了调用select函数到获取结果所经过程,可以看到,调用select函数前需要一些准备工作,调用后还需查看结果,接下来按照上述顺序逐一讲解
设置文件描述符
利用select函数可以同时监视多个文件描述符,当然,监视文件描述符可以视为监视套接字。此时首先需要将要监视的文件描述符集中到一起。集中时也要按照监视项(接收、传输、异常)进行区分,即按照上述三种监视项分成三类
使用fd_set数组变量执行此项操作,如图1-2所示,该数组是存有0和1的位数组
图1-2 fd_set结构体
图1-2中最左端的位表示文件描述符0(所在的位置),如果该位设置为1,则表示该文件描述符是监视对象。那么图中哪些文件描述符是监视对象呢?很明显,是文件描述符1和3。
那么是否应当通过文件描述符的数字直接将值注册到fd_set变量中?当然不是!针对fd_set变量的操作是以单位进行的,这也意味着直接操作该变量会比较繁琐,这些工作如果由自己完成,有可能会出错,于是,在fd_set变量中注册或更改值的操作都是由下列宏完成:
- FD_ZERO(fd_set *fdset):将fd_set变量的所有位都初始化为0
- FD_SET(int fd, fd_set *fdset):在参数fdset指向的变量中注册文件描述符fd的信息
- FD_CLR(int fd, fd_set *fdset):从参数fdset指向的变量中清除文件描述符fd的信息
- FD_ISSET(int fd, fd_set *fdset):若参数fdset指向的变量中包含文件描述符fd的信息,则返回“真”
上述函数中,FD_ISSET用于验证select函数的调用结果。通过图1-3解释这些函数的功能
图1-3 fd_set相关函数的功能
设置检查(监视)范围及超时
先来简单介绍select函数
#include <sys/select.h> #include <sys/time.h> int select(int maxfd, fd_set *readset, fd_set *writeset, fd_set *exceptset, const struct timeval *timeout);//成功时返回大于0的值,失败时返回-1
- maxfd:监视对象文件描述符数量
- readset:将所有关注“是否存在待读取数据”的文件描述符注册到fd_set型变量,并传递其地址值
- writeset:将所有关注“是否可传输无阻塞数据”的文件描述符注册到fd_set型变量,并传递其地址值
- exceptset:将所有关注“是否发生异常”的文件描述符注册到fd_set型变量,并传递其地址值
- timeout:调用select函数后,为防止陷入无限阻塞的状态,传递超时信息
- 返回值:发生错误时返回-1,超时返回时返回0。因发生关注的事件返回时,返回大于0的值,该值是发生事件的文件描述符数
如上所述,select函数用来用来验证三种监视项的变化情况,根据监视项声明三个fd_set型变量,分别向其注册文件描述符信息,并把变量的地址值传递到上述函数的第二到第四个参数。但在调用select函数之前,需要决定下面两件事:
- 文件描述符的监视范围
- 如何设定select函数的超时时间
第一,文件描述符的监视范围与select函数的第一个参数有关。实际上,select函数要求通过第一个参数传递监视对象文件描述符的数量。因此,需要得到注册在fd_set变量中的文件描述符数。但每次新建文件描述符时,其值都会加一,故只需将最大的文件描述符值加一再传递到select函数即可,加一是因为文件描述符的值从0开始
第二,select函数的超时时间与select函数的最后一个参数相关,其中timeval结构体定义如下:
struct timeval { long tv_sec; /* seconds */ long tv_usec; /* microseconds */ };
本来select函数只有在监视的文件描述符发生变化时才返回,如果未发生变化,就会进入阻塞状态,指定超时时间就是为了防止这种情况发生。通过声明上述结构体变量,将秒数填入tv_sec成员,将毫秒数填入tv_usec成员,然后将结构体的地址值传递到select函数的最后一个参数。此时,即使文件描述符中未发生变化,只要过了指定时间,也可以从函数中返回,不过这种情况下,select函数返回0。因此,可以通过返回值了解返回原因,如果不想设置超时,则传递NULL
调用select函数后查看结果
虽未给出示例,但图1-1中的步骤一“select函数调用前的所有准备工作”已讲解完毕,同时也介绍了select函数。而函数调用后查看结果也同样重要,我们已讨论过select函数的返回值,如果返回大于0的整数,说明相应数量的文件描述符发生变化
select函数返回正整数时,怎样获知哪些文件描述符发生了变化?向select函数的第二到第四个参数传递的fd_set变量中将产生如图1-4所示变化,获知过程并不难
图1-4 fd_set变量的变化
由图1-4可知,select函数调用完成后,向其传递的fd_set变量中将发生变化。原来为1的所有位均变为0,但发生变化的文件描述符对应位除外。因此,可以认为值仍然为1的位置上的文件描述符发生了变化
select.c
#include <stdio.h> #include <unistd.h> #include <sys/time.h> #include <sys/select.h> #define BUF_SIZE 30 int main(int argc, char *argv[]) { fd_set reads, temps; int result, str_len; char buf[BUF_SIZE]; struct timeval timeout; FD_ZERO(&reads); FD_SET(0, &reads); // 0 is standard input(console) /* timeout.tv_sec=5; timeout.tv_usec=5000; */ while (1) { temps = reads; timeout.tv_sec = 5; timeout.tv_usec = 0; result = select(1, &temps, 0, 0, &timeout); if (result == -1) { puts("select() error!"); break; } else if (result == 0) { puts("Time-out!"); } else { if (FD_ISSET(0, &temps)) { str_len = read(0, buf, BUF_SIZE); buf[str_len] = 0; printf("message from console: %s", buf); } } } return 0; }
- 第14、15行:第14行初始化fd_set变量,第15行将文件描述符0对应的位设置为1。换言之,需要监视标准输入的变化
- 第24行:将准备好的fd_set变量reads的内容复制到temps变量,因为之前讲过,调用select函数后,除发生变化的文件描述符对应位外,剩下的所有位将初始化为0。因此,为了记住初始值,必须经过这种复制过程。这是使用select函数的通用方法
- 第18、19行:请观察被注释的代码,这是为了设置select函数的超时而添加的。但不能在此时设置超时,因为调用select函数后,结构体timeval的成员tv_sec和tv_usec的值将被替换为超时前剩余时间。因此,调用select函数前,每次都要初始化timeval结构体变量
- 第25、26行:将初始化timeval结构体的代码插入循环后,每次调用select函数前都会初始化新值
- 第27行:调用select函数,如果有控制台输入数据,则返回大于0的整数。如果没有输入数据而引发超时,则返回0
- 第39~44行:select函数返回大于0的值时的运行区域,验证发生变化的文件描述符是否为标准输入。若是,则从标准输入读取数据并向控制台输出
编译select.c并运行
# gcc select.c -o select # ./select Hi message from console: Hi Hello message from console: Hello Time-out! Time-out! Good Bye message from console: Good Bye Time-out!
实现I/O复用服务端
下面通过select函数实现I/O复用服务端,之前已给出关于select函数的所有说明,下面示例是基于I/O复用的回声服务端
echo_selectserv.c
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <arpa/inet.h> #include <sys/socket.h> #include <sys/time.h> #include <sys/select.h> #define BUF_SIZE 100 void error_handling(char *buf); int main(int argc, char *argv[]) { int serv_sock, clnt_sock; struct sockaddr_in serv_adr, clnt_adr; struct timeval timeout; fd_set reads, cpy_reads; socklen_t adr_sz; int fd_max, str_len, fd_num, i; char buf[BUF_SIZE]; if (argc != 2) { printf("Usage : %s <port>\n", argv[0]); exit(1); } serv_sock = socket(PF_INET, SOCK_STREAM, 0); memset(&serv_adr, 0, sizeof(serv_adr)); serv_adr.sin_family = AF_INET; serv_adr.sin_addr.s_addr = htonl(INADDR_ANY); serv_adr.sin_port = htons(atoi(argv[1])); if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1) error_handling("bind() error"); if (listen(serv_sock, 5) == -1) error_handling("listen() error"); FD_ZERO(&reads); FD_SET(serv_sock, &reads); fd_max = serv_sock; while (1) { cpy_reads = reads; timeout.tv_sec = 5; timeout.tv_usec = 5000; if ((fd_num = select(fd_max + 1, &cpy_reads, 0, 0, &timeout)) == -1) break; if (fd_num == 0) continue; for (i = 0; i < fd_max + 1; i++) { if (FD_ISSET(i, &cpy_reads)) { if (i == serv_sock) // connection request! { adr_sz = sizeof(clnt_adr); clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_adr, &adr_sz); FD_SET(clnt_sock, &reads); if (fd_max < clnt_sock) fd_max = clnt_sock; printf("connected client: %d \n", clnt_sock); } else // read message! { str_len = read(i, buf, BUF_SIZE); if (str_len == 0) // close request! { FD_CLR(i, &reads); close(i); printf("closed client: %d \n", i); } else { write(i, buf, str_len); // echo! } } } } } close(serv_sock); return 0; } void error_handling(char *buf) { fputs(buf, stderr); fputc('\n', stderr); exit(1); }
- 第40行:向要传到select函数第二个参数的fd_set变量reads注册服务端套接字,这样,接收数据情况的监视对象就包含了服务端套接字。客户端的连接请求同样通过传输数据完成,因此,服务端套接字中有接收的数据,就意味着有新的请求
- 第49行:在while无限循环中调用select函数,select函数的第三和第四个参数为空,只需根据监视目的传递必要的参数
- 第54、56行:select函数返回大于等于1的值时执行的循环,第56行调用FD_ISSET函数,查找发生状态变化的(有接收数据的套接字)文件描述符
- 第58、63行:发生状态变化时,首先验证服务端套接字中是否有变化?如果是服务端套接字的变化,将受理连接请求。特别需要注意的是,第63行在fd_set变量reads中注册了与客户端连接的套接字文件描述符
- 第68行:发生变化的套接字并非服务端套接字时,即有要接收的数据,但此时需要确认接收的数据是字符串还是代表断开连接的EOF
- 第73、74行:接收的数据为EOF时需关闭套接字,并从reads中删除相应信息
- 第79行:接收的数据为字符串时,执行回声服务
编译echo_selectserv.c并运行
# gcc echo_selectserv.c -o echo_selectserv # ./echo_selectserv 8500 connected client: 4 connected client: 5 closed client: 4 closed client: 5
echo_client ONE:
# ./echo_client 127.0.0.1 8500 Connected........... Input message(Q to quit): Hello world! Message from server: Hello world! Input message(Q to quit): Apple Message from server: Apple Input message(Q to quit): Banana Message from server: Banana Input message(Q to quit): q
echo_client TWO:
# ./echo_client 127.0.0.1 8500 Connected........... Input message(Q to quit): Java Message from server: Java Input message(Q to quit): Python Message from server: Python Input message(Q to quit): Golang Message from server: Golang Input message(Q to quit): q