Redis实现之事件
事件
Redis服务器是一个事件驱动程序,服务器需要处理以下两类事情:
- 文件事件(file event):Redis服务器通过套接字与客户端(或者其他Redis服务器)进行连接,而文件事件就是服务器对套接字操作的抽象。服务器与客户端(或者其他服务器)的通信会产生相应的文件事件,而服务器则通过监听并处理这些事件来完成一系列网络通信操作
- 时间事件(time event):Redis服务器中的一些操作(比如serverCron函数)需要在给定的时间点执行,而时间事件就是服务器对这类定时操作的抽象
文件事件
Redis是基于Reactor模式开发了自己的网络事件处理器,这个处理器被称为文件事件处理器:
- 文件事件处理器使用I/O多路复用程序来同时监听多个套接字,并根据套接字目前执行的任务来为套接字关联不同的事件处理器
- 当被监听的套接字准备好执行连接应答(accept)、读取(read)、写入(write)、关闭(close)等操作时,与操作相对应的文件事件就会产生,这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件
虽然文件事件处理器以单线程方式运行,但通过使用I/O多路复用程序来监听多个套接字,文件事件处理器既实现了高性能的网络通信模型,又可以很好地与Redis服务器中其他同样以单线程方式运行的模块进行对接,这保持了Redis内部单线程设计的简单性
文件事件处理器的构成
图1-1展示了文件事件处理器的四个组成部分,它们分别是套接字、I/O多路复用程序、文件事件分派器,以及事件处理器
图1-1 文件事件处理器的四个组成部分
文件事件是对套接字操作的抽象,每当一个套接字准备好执行连接应答(accept)、写入、读取、关闭等操作时,就会产生一个文件事件。因为一个服务器通常会连接多个套接字,所以多个文件事件有可能会并发地出现。I/O多路复用程序负责监听多个套接字,并向文件事件分派器传送那些产生了事件的套接字
尽管多个文件事件可能会并发地出现,但I/O多路复用程序总是会将所有产生事件的套接字都放到一个队列中,然后通过这个队列,以有序、同步、每次一个套接字的方式向文件事件分派器传送套接字。当上一个套接字产生的实践被处理完毕之后(该套接字为事件所关联的事件处理器执行完毕),I/O多路复用程序才会继续向文件事件分派器传送下一个套接字,如图1-2所示
图1-2 I/O多路复用程序通过队列向文件事件分派器传送套接字
文件事件分派器接收I/O多路复用程序传来的套接字,并根据套接字产生的事件的类型,调用相应的事件处理器。服务器会为执行不同任务的套接字关联不同的事件处理器,这些处理器是一个个函数,它们定义了某个事件发生时,服务器应该执行的动作
I/O多路复用程序的实现
Redis的I/O多路复用程序的所有功能都是通过包装常见的select、epoll、evport和kqueue这些I/O多路复用函数库来实现的,每个I/O多路复用函数库在Redis源码中都对应一个单独的文件,比如ae_select.c、ae_epoll.c、ae_kqueue.c,诸如此类。因为Redis为每个I/O多路复用函数库都实现了相同的API,所以I/O多路复用程序的底层实现时可以互换的,如图1-3所示
图1-3 Redis的I/O多路复用程序有多个I/O多路复用库实现可选
Redis在I/O多路复用程序的实现源码中用#include宏定义了相应的规则,程序会在编译时自动选择系统中性能最高的I/O多路复用函数库来作为Redis的I/O多路复用程序的底层实现
ae.c
/* Include the best multiplexing layer supported by this system. * The following should be ordered by performances, descending. */ #ifdef HAVE_EVPORT #include "ae_evport.c" #else #ifdef HAVE_EPOLL #include "ae_epoll.c" #else #ifdef HAVE_KQUEUE #include "ae_kqueue.c" #else #include "ae_select.c" #endif #endif #endif
事件的类型
/O多路复用程序可以监听多个套接字的ae.h/AE_READABLE事件和ae.h/AE_WRITABLE事件,这两类事件和套接字操作之间的对应关系如下:
- 当套接字变得可读时(客户端对套接字执行write操作,或执行close操作),或有新的可应答(acceptable)套接字出现时(客户端对服务器的监听套接字执行connect操作),套接字产生AE_READABLE事件
- 当套接字变得可写时(客户端对套接字执行read操作),套接字产生AE_WRITABLE事件
/O多路复用程序允许服务器同时监听套接字的AE_READABLE事件和AE_WRITABLE事件,如果一个套接字同时产生了这两种事件,那么文件分派器会优先处理AE_READABLE事件之后,再处理AE_WRITABLE事件。也就是说,如果一个套接字可读又可写的话,那么服务器会先读取套接字,后写套接字
API
- ae.c/aeCreateFileEvent函数接受一个套接字描述符、一个事件类型、以及一个事件处理器作为参数,将给定套接字的事件加入到I/O多路复用程序的监听范围内,并对事件和事件处理器进行关联
- ae.c/aeDeleteFileEvent函数接受一个套接字描述符和一个监听事件类型作为参数,让I/O多路复用程序取消对给定套接字的给定事件的监听,并取消事件和事件处理器之间的关联
- ae.c/aeGetFileEvents函数接受一个套接字描述符,返回该套接字正在被监听的事件类型:
- 如果套接字没有任何事件被监听,那么函数返回AE_NONE
- 如果套接字的读事件正在被监听,那么函数返回AE_READABLE
- 如果套接字的写事件正在被监听,那么函数返回AE_WRITABLE
- 如果套接字的读事件和写事件正在被监听,那么函数返回AE_READABLE|AE_WRITABLE
- ae.c/aeWait函数接受一个套接字描述符、一个事件类型和一个毫秒数为参数,在给定的时间内阻塞并等待套接字的给定类型事件产生,当事件成功产生,或者等待超时之后,函数返回
- ae.c/aeApiPoll函数接受一个sys/time.h/struct timeval结构为参数,并在指定的时间內,阻塞并等待所有被aeCreateFileEvent函数设置为监听状态的套接字产生文件事件,当有至少一个事件产生,或者等待超时后,函数返回
- ae.c/aeProcessEvents函数是文件事件分派器,它先调用aeApiPoll函数来等待事件产生,然后遍历所有已产生的事件,并调用相应的事件处理器来处理这些事件
- ae.c/aeGetApiName函数返回I/O多路复用程序底层所使用的I/O多路复用函数库的名称:返回"select"表示底层为select函数库,诸如此类
文件事件的处理器
Redis为文件事件编写了多个处理器,这些事件处理器分别用于实现不同的网络通信需求,比如说:
- 为了对连接服务器的各个客户端进行应答,服务器要为监听套接字关联连接应答处理器
- 为了接收客户端传来的命令请求,服务器要为客户端套接字关联命令请求处理器
- 为了向客户端返回命令的执行结果,服务器要为客户端套接字关联命令回复处理器
- 当主服务器和从服务器进行复制操作时,主从服务器都需要关联特别为复制功能编写的复制处理器
在这些事件处理器中,服务器最常用的要数与客户端进行通信的连接应答处理器、命令请求处理器和命令回复处理器
连接应答处理器
networking.c/acceptTcpHandler函数是Redis的连接应答处理器,这个处理器用于对连接服务器监听套接字的客户端进行应答,具体实现为为sys/socket.h/accept函数的包装。当Redis服务器进行初始化的时候,程序会将这个连接应答处理器和服务监听套接字的AE_READABLE事件关联起来,当有客户端用sys/socket.h/connect函数连接服务端监听套接字时,套接字就会产生AE_READABLE事件,引发连接应答处理器执行,并执行相应的套接字应答操作,如图1-4所示
图1-4 服务器对客户端的连接请求进行应答
命令请求处理器
networking.c/readQueryFromClient函数是Redis的命令请求处理器,这个处理器负责从套接字中读入客户端发送的命令请求内容,具体实现为unistd.h/read函数的包装。当一个客户端通过连接应答处理器成功连接到服务器之后,服务器会将客户端套接字的AE_READABLE事件和命令请求处理器关联起来,当客户端向服务器发送命令请求的时候,套接字就会产生AE_READABLE事件,引发命令请求处理器执行,并执行相应的套接字读入操作,如图1-5所示。在客户端连接服务器的整个过程中,服务器都会一直为客户端套接字的AE_READABLE事件关联命令请求处理器
图1-5 服务器接收客户端发送来的命令请求
命令回复处理器
networking.c/sendReplyToClient函数是Redis的命令回复处理器,这个处理器负责将服务器执行命令后得到的命令回复通过套接字返回给客户端,具体实现为unistd.h/write函数的包装。当服务器有命令回复需要传送给客户端的时候,服务器会将客户端套接字的AE_WRITABLE事件和命令回复处理器关联起来,当客户端准备好接收服务器传回的命令回复时,就会产生AE_WRITABLE事件,引发命令回复处理器执行,并执行相应的套接字写入操作,如图1-6所示。当命令回复发送完毕之后,服务器就会解除命令回复处理器与客户端套接字的AE_WRITABLE事件之间的关联
图1-6 服务器向客户端发送命令回复
一次完整的客户端与服务器连接事件示例
假设一个Redis服务器正在运作,那么这个服务器的监听套接字的AE_READABLE事件应该正处于监听状态下,而该事件所对应的处理器为连接应答处理器。如果这时有一个Redis客户端向服务器发起连接,那么监听套接字将产生AE_READABLE事件,触发连接应答处理器执行。处理器会对客户端的连接请求进行应答,然后创建客户端套接字,以及客户端状态,并向客户端套接字的AE_READABLE事件与命令请求处理器进行关联,使得客户端可以向主服务器发送命令请求
之后,假设客户端向主服务器发送一个命令请求,那么客户端套接字将产生AE_READABLE事件,引发命令请求处理器执行,处理器读取客户端命令内容,然后传给相关程序去执行。执行命令将产生相应的命令回复,为了将这些命令回复传送给客户端,服务器会将客户端套接字的AE_WRITABLE事件与命令回复处理器进行关联。当客户端尝试读取命令回复时,客户端套接字将产生AE_WRITABLE事件,触发命令回复处理器执行,当命令回复处理器将命令回复全部写入到套接字之后,服务器就会解除客户端套接字的AE_WRITABLE事件与命令回复处理器之间的关联
图1-7总结了上面描述的整个通信过程,以及通信时用到的事件处理器
图1-7 客户端和服务器的通信过程
时间事件
Redis的时间事件分为以下两类:
- 定时事件:让一段程序在指定的时间之后执行一次。比如说,让程序X在当前时间的30毫秒之后执行一次
- 周期性事件:让一段程序每隔指定时间就执行一次。比如说,让程序Y每隔30毫秒就执行一次
一个时间事件主要由以下三个属性组成:
- id:服务器为时间事件创建的全局唯一ID(标识号)。ID号按从小到大的顺序递增,新事件的ID号比旧事件的ID号要大
- when:毫秒精度的UNIX时间戳,记录了时间事件的到达(arrive)时间
- timeProc:时间事件处理器,一个函数。当时间事件到达时,服务器就会调用相应的处理器来处理事件
一个时间事件是定时事件还是周期性事件取决于时间事件处理器的返回值:
- 如果事件处理器返回ae.h/AE_NOMORE,那么这个事件为定时事件:该事件在达到一次之后就会被删除,之后不再到达
- 如果事件处理器返回一个非AE_NOMORE的整数值,那么这个事件为周期性时间:当一个时间事件到达之后,服务器会根据事件处理器返回的值,对时间事件的when属性进行更新,让这个事件在一段时间之后再次到达,并以这种方式一直更新并运行下去。比如说,如果一个时间事件的处理器返回整数值30,那么服务器应该对这个时间事件进行更新,让这个事件在30毫秒之后再次到达
实现
服务器将所有时间事件都放在一个无序链表中,每当时间事件执行器运行时,它就遍历整个链表,查找所有已达的时间事件,并调用相应的事件处理器。图1-8展示了一个保存时间事件的链表的例子,链表中包含了三个不同的时间事件:因为新的时间事件总是插入到链表的表头,所以三个时间事件分别按ID逆序排序,表头事件的ID为3,中间事件的ID为2,表尾事件的ID为1
图1-8 用链表连接起来的三个时间事件
我们说保存时间事件的链表为无序链表,指的不是链表不按ID排序,而是说,该链表不按when属性的大小排序。正因为链表没有按when属性进行排序,所以当时间事件执行器运行的时候,它必须遍历链表中的所有时间事件,这样才能确保服务器中所有已达到时间事件都会被处理
API
- ae.c/aeCreateTimeEvent函数接受一个毫秒数milliseconds和一个时间事件处理器proc作为参数,将一个新的时间事件添加到服务器,这个新的时间事件将在当前时间的milliseconds毫秒之后到达,而事件的处理器为proc。
例如,如果服务器当前保存的时间事件如图1-9所示,那么当程序以50毫秒和handler_3处理器为参数,在时间1385877599980(2013年12月1日零时前20毫秒)时调用aeCreateTimeEvent函数,服务器将创建ID为3的时间事件,这时服务器所保存的时间事件将如图1-8所示
图1-9 用链表连接起来的两个时间事件
- ae.c/aeDeleteFileEvent函数接受一个时间事件ID作为参数,然后从服务器中删除该ID所对应的时间事件
- ae.c/aeSearchNearestTimer函数返回到达时间距离当前时间最接近的那个时间事件
- ae.c/processTimeEvents函数是时间事件的执行器,这个函数会遍历所有已到达的时间事件,并调用这些事件的处理器。已到达指的是,时间事件的when属性记录的Unix时间戳等于或小于当前时间的Unix时间戳
举个栗子,如果服务器保存的时间事件如图1-8所示,并且当前时间为1385877600010(2013年12月1日零时之后10毫秒),那么processTimeEvents函数将处理图中ID为2和1的时间事件,因为这两个时间的到达时间都大于等于1385877600010
processTimeEvents函数的定义可以用以下伪代码来描述:
def processTimeEvents(): #遍历服务器中的所有时间事件 for time_event in all_time_event(): #检查事件是否已经到达 if time_event.when <= unix_ts_now(): #事件已到达 #执行事件处理器,并获取返回值 retval = time_event.timeProc() #如果这是一个定时事件 if retval == AE_NOMORE: #那么将该事件从服务器中删除 delete_time_event_from_server(time_event) #如果这是一个周期性事件 else: #那么按照事件处理器的返回值更新时间事件的when属性 #让这个事件在指定的时间之后再次到达 update_when(time_event, retval)
时间事件应用实例:serverCron函数
持续运行的Redis服务器需要定期对自身的资源和状态进行检查和调整,从而确保服务器可以长期、稳定地运行,这些定期操作由redis.c/serverCron函数负责执行,它的主要工作包括:
- 更新服务器的各类统计信息,比如时间、内存占用、数据库占用情况等
- 清理数据库中的过期键值对
- 关闭和清理连接失效的客户端
- 尝试进行AOF或RDB持久化操作
- 如果服务器是主服务器,那么对从服务器进行定期同步
- 如果处于集群模式,对集群进行定期同步和连接测试
Redis服务器以周期性事件的方式来运行serverCron函数,在服务器运行期间,每隔一段时间, serverCron就会执行一次,直到服务器关闭为止。在Redis2.6版本,服务器默认规定serverCron每秒运行10次,平均每间隔100毫秒运行一次。从Redis2.8开始,用户可以通过修改hz选项来调整serverCron的每秒执行次数,具体信息请参考示例配置文件redis.conf关于hz选项的说明
事件的调度与执行
因为服务器同时存在文件事件和时间事件两种事件类型,所以服务器必须对两种事件进行调度,决定何时处理文件事件,何时处理时间事件,以及花多少时间来处理它们等等。事件的调度和执行由ae.c/aeProcessEvents函数负责。可以用以下源代码完成:
def aeProcessEvents(): #获取到达时间离当前时间最接近的时间事件 time_event = aeSearchNearestTimer() #计算最接近的时间事件距离到达还有多少毫秒 remaind_ms = time_event.when - unix_ts_now() #如果事件已到达,那么remaind_ms的值可能为负数,将它设定为0 if remaind_ms < 0: remaind_ms = 0 #根据remaind_ms的值,创建timeval结构 timeval = create_timeval_with_ms(remaind_ms) #阻塞并等待文件事件产生,最大阻塞时间由传入的timeval结构决定 #如果remaind_ms的值为0,那么aeApiPoll调用之后马上返回,不阻塞 aeApiPoll(timeval) #处理所有已产生的文件事件(其实并没有这个函数) processFileEvents() #处理所有已到达的时间事件 processTimeEvents()