epoll的由来
reference
https://www.zhihu.com/question/20122137
数据流有两个重要的参与者:
1、往流中写入数据者
2、从流中读取数据者
假设两个参与者之间,使用一个缓冲区来存放数据,即a往缓冲区中写入数据,b从缓冲区中读出数据。那么对单个流而言,会存在四种状态:
0、当缓冲区为空时,b阻塞,等待数据到达;
1、当a往缓冲区写入数据时,缓冲区非空,b将被从阻塞状态中唤醒;
2、当a拼命往缓冲区中写入数据,而b没有去读,或读的速度跟不上a写入的速度时,缓冲区满。此时,需要通知a进行阻塞,等待缓冲区中重新腾出空间;
3、当b从缓冲区中读出部分数据后,缓冲区非满,则可以通知a从阻塞状态中醒来;
4、当a不再往缓冲区中写数据,而b一直读,将缓冲区中的数据读完时,将变成缓冲区空,此时通知b进入阻塞状态,等待有数据到来。
当有多个流时,可以考虑用轮训的方式逐一查看每个流目前是否有数据,若有,则进行处理。(非阻塞忙轮询--一直主动查看流的状态)
缺点:cpu空耗在无用的流缓冲区检查上,浪费时间。
改进:引入一个代理人(select),当代理人感知到有一个或多个流的数据有变化时,再进行轮询检查。(非阻塞轮询--有流的状态发生变化时,主动检查所有流的状态)
缺点:当只有一个或少数流有更新时,遍历检查所有的流非常浪费时间。(故,亦称为无差别轮询)
改进:当有流的状态改变时,仅处理该流相关的数据变化。(epoll--event poll,事件轮询,精确到“什么流”发生了“什么事件”)
具体实现是引入了一个红黑树及一个就绪列表。
epoll的关键操作:
1、创建一个epoll对象
epollfd=epoll_create()
此时,会在内核中专属于epoll的高速cache区新建一棵红黑树以及一个就绪列表。
2、往epoll中添加或删除某个流的某个事件
epoll_ctl(epollfd, EPOLL_CTL_ADD, socket, EPOLLIN)
epoll_ctl(epollfd, EPOLL_CTL_DEL, socket, EPOLLOUT)
"add"动作会将文件句柄(socket)加入到红黑树中,并向内核注册改句柄的回调函数,当内核检测到该句柄可读或可写时(由中断触发),就将该句柄对应的回调函数加入到就绪列表中。
3、等待事件发生
epoll_wait(epollfd,...)
epoll_wait函数只需要关注就绪列表即可。
当就绪列表中有就绪的socket时,就将这些socket拷贝到用户态,并清空就绪列表。
而后,还会检查这些socket的触法形式(水平出发or边缘触法)
若是水平触发(lt),则若这些socket中还有未处理的事件时,就再把它们加回到就绪列表中;
若是边缘触发(et),则只有当下一次中断到达时,才会把这个socket加回到就绪列表中。
从伪代码上可以更明显的看出三种轮询的区别:
无阻塞忙轮询:
while true{
for i in stream[]{
if i has data
read until unavailable
}
}
无阻塞轮询(无差别轮询):
while true{
select(stream[])
for i in stream[]{
if i has data
read until unavailable
}
}
事件轮询(epoll):
while true{
active_stream[] = epoll_wait(epollfd)
for i in active_stream[]{
read or write until unavailable
}
}