关于select的困惑

困惑

首先,我知道select是IO复用。以UDP为例,select流程大体如下:

 1     for(;;) {
 2         //通过FD_SET告诉内核你感兴趣的fd
 3         fd_set read_fds;
 4         FD_CLEAR(&read_fds);
 5         FD_SET(fd[0],&read_fds);
 6         ...
 7         FD_SET(fd[n-1],&read_fds);
 8         int maxfdp1 = max(fd[0],...,fd[n-1]) + 1; //获取最大的fd+1
 9 
10         //select采取轮训模式采取
11         struct timeval tv=0;
12         nready = select(maxfdp1 ,&fd_rds, NULL, NULL,&tv);
13         
14         //有FD可读
15         if (nready > 0) {
16             for (int i=0;i<n;i++) {
17                 if(FD_ISSET(fd[i], &read_fds)) {
18                     recvfrom();
19                     doSomething();    //没有多线程
20                 }
21             }
22         }
23     }

但是网上很多人都说这个框架使得服务端实现了并发。我很好奇的是,这个并发是怎么实现的?

因为select返回大于0后,开始检查read_fds,看是哪些FD已经可读。比如fd1和fd5可读了,我肯定先处理fd1的数据,这时候我可能处理的时间较长(比如说1秒),那么fd5就是要1s后才能处理,这样怎么就并发了呢?要是有100个FD可读,每个fd的数据都花了1秒处理,那么这个框架性能岂不是很差。

注意:我是想说在dosomething()没有多线程的情况下,不就是顺序执行的,一个一个FD按个处理。可能我对并发的理解也不到位,希望有高手能帮我答疑解惑。非常感谢。

 

解惑

我对并发有误解。并发和并行是不一样的。并行指的是同一时刻多个进程或线程同时处理。并发指的是一段时间内(比如30s)处理多个任务或fd。这样的话,疑惑就解开了。

 

题外话:IO复用究竟是什么

IO复用的本质是内核级别的对多个fd进行轮询,然后哪个好了就通知用户代码。这么的优点是,如果没有IO复用,用户需要自己去轮询哪个fd准备好了,亦或更糟糕一点,一个线程阻塞等待一个fd。因此IO复用只是在fd是否就绪这个问题上帮助用户代码,所谓就绪包括请求到来。但是真正处理请求。但是真正处理请求,是由用户自己的工作进程或工作线程来处理的,如果同时请求量过大,超过了单机处理的能力,那么需要我们自己设计多线程或者线程池排队或者分流机制,这个和IO复用不冲突,也没有关系。

 

select的缺点

老生长谈的问题了。

1、最大并发数限制:使用32个整数的32位,即32*32=1024来标识fd,虽然可修改,但是有以下第二点的瓶颈;

2、效率低:每次都会线性扫描整个fd_set,集合越大速度越慢;

3、内核/用户空间内存拷贝问题。把fd_set从用户态拷贝到内核态,然后又要拷贝出来,效率低。

 

posted @ 2018-02-28 21:28  guhowo  阅读(304)  评论(0编辑  收藏  举报