关于select的困惑

困惑

首先，我知道select是IO复用。以UDP为例，select流程大体如下：

 1     for(;;) {
 2         //通过FD_SET告诉内核你感兴趣的fd
 3         fd_set read_fds;
 4         FD_CLEAR(&read_fds);
 5         FD_SET(fd[0],&read_fds);
 6         ...
 7         FD_SET(fd[n-1],&read_fds);
 8         int maxfdp1 = max(fd[0],...,fd[n-1]) + 1; //获取最大的fd+1
 9 
10         //select采取轮训模式采取
11         struct timeval tv=0;
12         nready = select(maxfdp1 ,&fd_rds, NULL, NULL,&tv);
13         
14         //有FD可读
15         if (nready > 0) {
16             for (int i=0;i<n;i++) {
17                 if(FD_ISSET(fd[i], &read_fds)) {
18                     recvfrom();
19                     doSomething();    //没有多线程
20                 }
21             }
22         }
23     }

但是网上很多人都说这个框架使得服务端实现了并发。我很好奇的是，这个并发是怎么实现的？

因为select返回大于0后，开始检查read_fds，看是哪些FD已经可读。比如fd1和fd5可读了，我肯定先处理fd1的数据，这时候我可能处理的时间较长（比如说1秒），那么fd5就是要1s后才能处理，这样怎么就并发了呢？要是有100个FD可读，每个fd的数据都花了1秒处理，那么这个框架性能岂不是很差。

注意：我是想说在dosomething()没有多线程的情况下，不就是顺序执行的，一个一个FD按个处理。可能我对并发的理解也不到位，希望有高手能帮我答疑解惑。非常感谢。

解惑

我对并发有误解。并发和并行是不一样的。并行指的是同一时刻多个进程或线程同时处理。并发指的是一段时间内（比如30s）处理多个任务或fd。这样的话，疑惑就解开了。

题外话:IO复用究竟是什么

IO复用的本质是内核级别的对多个fd进行轮询，然后哪个好了就通知用户代码。这么的优点是，如果没有IO复用，用户需要自己去轮询哪个fd准备好了，亦或更糟糕一点，一个线程阻塞等待一个fd。因此IO复用只是在fd是否就绪这个问题上帮助用户代码，所谓就绪包括请求到来。但是真正处理请求。但是真正处理请求，是由用户自己的工作进程或工作线程来处理的，如果同时请求量过大，超过了单机处理的能力，那么需要我们自己设计多线程或者线程池排队或者分流机制，这个和IO复用不冲突，也没有关系。

select的缺点

老生长谈的问题了。

1、最大并发数限制：使用32个整数的32位，即32*32=1024来标识fd，虽然可修改，但是有以下第二点的瓶颈；

2、效率低：每次都会线性扫描整个fd_set，集合越大速度越慢；

3、内核/用户空间内存拷贝问题。把fd_set从用户态拷贝到内核态，然后又要拷贝出来，效率低。

posted @ 2018-02-28 21:28 guhowo 阅读(319) 评论(0) 收藏举报

刷新页面返回顶部

guhowo

关于select的困惑

困惑

解惑

题外话:IO复用究竟是什么

公告