[原]浅谈几种服务器端模型——反应堆的设计
引言:持续更新了一段时间的博客,今天把最后一点部分加上,一个简单的反应堆的实现,基于epoll,工作过程上一篇博文已经有所介绍。
需要再次提到的就是关于反应堆的使用方式:
注册事件(为需要监听的fd加入回调函数)----->将事件加入反应堆------>开始事件循环------>事件发生,调用回调函数
第一次加入的描述符可以为监听描述符,即由 socket() 函数创建,当这个描述符有事件发生,意味着有新的连接的到来,调用回调函数handler_accept() 其中这个函数里面涉及到调用 accept()系统调用和为这个新连接分配实例,然后设置这个连接的回调函数,即 handler_read() handler_write() 等,设置完后相应的连接描述符如果有事件发生,即可以调用相应的不同种事件的回调函数。这个是我们的总体思路,如果需要多进程方式,可以创建多进程,然后每个进程不同的反应堆,但是需要注意的是,如果父子进程共享监听描述符,会引起进程组的惊群现象,就是说,每一个进程都可能会尝试 accept() 这个新的连接,那么这种方式设计的时候需要为 accept() 加锁,具体方式可以看Nginx关于这方面的设计,不仅实现了 accept() 锁,还达到了进程间的负债均衡。
关于连接对象池,可以下次写一篇博文介绍一下对象池的设计方式。
言归正传,说说反应堆的设计方式,如果需要方便的话,可以使用libevent..memcached的网络模块就是基于这个,相信大家也知道。
从上上篇关于 epoll 的介绍中就可以看到,事件是整个系统设计的核心,我们的整个反应堆都是围绕一个叫做事件的东西来做相应的处理。
那么,作为应用层的事件,可以这么说来,就是那个地方发生了某件事情,而这个事情是在我们的规定范围的,然后,我们需要知道这个事件给予了我们什么样的权利,比如说,我们可以读,可以写,可以操作等等.
(下面不加说明,都是以 epoll 为例 )
操作系统为我们提供的接口也是类似的操作
创建一个 epoll -----> 注册相应的事件 epoll_ctl() -----> 进入事件循环监听事件(可能超时返回 )epoll_wait() ----->返回事件 ( event_list[i].event && EPOLLIN )等
我们需要做的事情就是,为这个流程的事件做一个封装,并能够有效的管理整个事件,而不是离散的处理。
看看 event的封装:
typedef struct mc_event_s { struct mc_event_s *next ; struct mc_event_s *prev ; unsigned int min_heap_index ; int ev_fd ; // file des of event short revent ; // event type struct timeval ev_timeval ; // event timeout time mc_ev_callback callback ;// callback of this event void *args ; int ev_flags ; mc_event_base_t *base ; }mc_event_t ;
两个指针分别指向事件的前部和后部,标准的双向队列方式,没什么可说的。
min_heap_index 是作为超时管理的最小堆的下标,目前还没有最这方面的设计,可以先忽略。
ev_fd 是作为这个事件的描述符本身, callback 是注册在事件上的回调函数, ev_flags 是事件的状态,由宏定义为:
#define MC_EV_INITD 0x0001 #define MC_EV_ADDED 0x0002 #define MC_EV_ACTIVE 0x0004 #define MC_EV_DELED 0x0008
状态分为 是否初始化,是否加入了队列,是否加入了激活的队列,已删除。
这里注意的是事件分为两个队列,一个是已加入的,另一个是激活的。我们在处理的时候会将accept()返回的时间加入到已加入的队列,当有事件发生,将这个事件加入到激活的事件队列中,然后依次轮训处理每一个激活的事件。
整个反应堆需要一个控制块,也就是反应堆的实例,结构是像这样:
typedef struct mc_event_base_s { void * added_list ; void * active_list ; unsigned int event_num ; unsigned int event_active_num; /* *mc_minheap minheap ; */ int epoll_fd ; //for epoll only int ev_base_stop ; int magic ; struct timeval event_time ; }mc_event_base_t ;
可以看到,反应堆中维护了两个队列, added_list 和 active_list 为的是能够有效控制所有的事件。
event_num是事件个数, event_active_num 是已激活的事件个数
epoll_fd 是由epoll_create()创建的句柄,这里没有加入宏定义来区分是否操作系统有 epoll
可以这样:
#if (HAVE_EPOLL)
int epoll_fd ;
#endif
不同的IO多路复用方式不同,操作句柄也不一样。
ev_base_stop是用来判断是否停止的标志位, magic 被定义为一个宏:
#define MC_BASE_MAGIC 0x1989
用来判断整个反应堆是否初始化。
为事件的封装提供了几种操作,初始化,加入队列,删除事件,改变事件类型,循环监听事件。
然后将struct mc_event_ops 中的函数指针与实际的操作分开,类似于HOOK 方式,这样做的目的是为不同的底层IO多路复用提供了统一的接口,如 select(),epoll(),kqueue()等。
typedef struct mc_event_ops { void * (*init)( mc_event_base_t * ) ; int (*add)( void * , mc_event_t * ); int (*del)( void * , mc_event_t * ); int (*mod)( void * , mc_event_t * ); int (*dispatch)( void * , mc_event_base_t * ,struct timeval ) ; }mc_event_opt ; /* * Functions point of events option * there points will point to a instance of function * and other module call there function by ops instance */ extern mc_event_opt mc_event_op_val ; #define mc_event_ini mc_event_op_val.init #define mc_event_add mc_event_op_val.add #define mc_event_del mc_event_op_val.del #define mc_event_mod mc_event_op_val.mod #define mc_event_loop mc_event_op_val.dispatch
看看实际的操作事件方式,我们为这几个操作添加了epoll 的钩子,具体是下面这样:
对应mc_event_ops的第一个钩子
void *mc_epoll_init( mc_event_base_t *meb ) { if( meb->magic != MC_BASE_MAGIC ) { fprintf(stderr,"In function mc_epoll_init %d , %s ",__LINE__,__FILE__); return NULL ; } meb->epoll_fd = epoll_create( MC_EVENT_MAX ) ; return meb ; }
方式很简单,调用 epoll_create() 创建一个 epoll 实例,并把这个实例的句柄赋给反应堆。
第二个加入,对应mc_event_ops的第二个钩子
int mc_epoll_add( void * arg ,mc_event_t *ev ) { if( ev->base->magic != MC_BASE_MAGIC ) { fprintf(stderr,"In function mc_epoll_add %d , %s ",__LINE__,__FILE__); return -1 ; } mc_event_base_t *base = ev->base ; int epoll_fd = base->epoll_fd ; int err ; struct epoll_event epoll_ev ; epoll_ev.data.ptr = ev ; epoll_ev.events = EPOLLIN|EPOLLET ; if( !( ev->ev_flags & MC_EV_ADDED ) ) { err = epoll_ctl( epoll_fd , EPOLL_CTL_ADD , ev->ev_fd , &epoll_ev ); if( err != 0 ) { perror("epoll_ctl"); fprintf(stderr, "In function mc_epoll_add the epoll_ctl error in file:%s,line:%d\n",__FILE__,__LINE__); return -1; } ev->ev_flags |= MC_EV_ADDED ; } return 0; }
具体来说是调用了 epoll_ctl 并设置宏为 EPOLL_CTL_ADD然后设置事件类型
第三个:
int mc_epoll_del( void * arg ,mc_event_t *ev ) { if( ev->base->magic != MC_BASE_MAGIC ) { fprintf(stderr,"In function mc_epoll_add %d , %s ",__LINE__,__FILE__); return -1 ; } mc_event_base_t *base = ev->base ; int epoll_fd = base->epoll_fd ; int err ; if( !(ev->ev_flags & MC_EV_INITD) ) { return -1 ; } err = epoll_ctl( epoll_fd , EPOLL_CTL_DEL , ev->ev_fd , NULL ); if( err != 0 ) { fprintf(stderr, "In function mc_epoll_del the epoll_ctl error in file:%s,line:%d\n",__FILE__,__LINE__); return -1; } ev->ev_flags = 0x0000 ; return 0; }
第四个:
int mc_epoll_mod(void * arg ,mc_event_t *ev ) { if( ev->base->magic != MC_BASE_MAGIC ) { fprintf(stderr,"In function mc_epoll_mod %d , %s ",__LINE__,__FILE__); return -1 ; } mc_event_base_t *base = ev->base ; int epoll_fd = base->epoll_fd ; int err ; unsigned int mode ; if( !(ev->ev_flags & MC_EV_INITD) ) { return -1 ; } struct epoll_event epoll_ev ; epoll_ev.data.ptr = ev ; if( arg == NULL ) { return 0; } mode = *(unsigned int *)arg ; epoll_ev.events = mode ; err = epoll_ctl( epoll_fd , EPOLL_CTL_MOD , ev->ev_fd , &epoll_ev ); if( err != 0 ) { fprintf(stderr, "In function mc_epoll_del the epoll_ctl error in file:%s,line:%d\n",__FILE__,__LINE__); return -1; } return 0; }
第五个钩子:
int mc_epoll_loop( void * args , mc_event_base_t *base , struct timeval ev_time ) { if( base == NULL ) { fprintf(stderr,"base == NULL in mc_epoll_loop in file:%s,line:%d\n",__FILE__,__LINE__); return -1 ; } if( base->magic != MC_BASE_MAGIC ) { fprintf(stderr,"In function mc_epoll_mod %d , %s ",__LINE__,__FILE__); return -1 ; } int nfds ; /* we pass args as nevents in this function */ struct epoll_event *nevents = ( struct epoll_event * )args ; struct epoll_event epoll_ev ; nfds = epoll_wait( base->epoll_fd , nevents , MC_EVENT_MAX , 1) ; if( nfds <= -1 ) { fprintf(stderr,"epoll wait function in mc_epoll_loop in file:%s,line:%d\n",__FILE__,__LINE__); return nfds ; } return nfds ; }
实现方式具体可以看相应的代码。文章有点长了,很多代码就不贴出来了。
然后看看最后的一开始提到的几个操作:
注册事件(为需要监听的fd加入回调函数)----->将事件加入反应堆------>开始事件循环------>事件发生,调用回调函数
mc_event_base_t * mc_base_new(void) { mc_event_base_t * base = (mc_event_base_t *)malloc( sizeof(mc_event_base_t) ); if( base == NULL ) { fprintf(stderr,"Init the base moudle in mc_base_new error in file:%s,line:%d\n",__FILE__,__LINE__); return NULL ; } /* init the base lists */ base->added_list = NULL ; base->active_list = NULL ; base->magic = MC_BASE_MAGIC ; base->event_num = 0 ; base->event_active_num = 0 ; base->ev_base_stop = MC_BASE_STOP ; base->magic = MC_BASE_MAGIC ; gettimeofday(&base->event_time,NULL); mc_event_ini( base ) ; return base ; } int mc_event_set( mc_event_t *ev , short revent , int fd , mc_ev_callback callback , void *args ) { if( ev == NULL ) { fprintf(stderr, " mc_event_set error , ev == NULL or other segment error in file:%s,line:%d\n",__FILE__,__LINE__); return -1 ; } #if (HAVE_EPOLL) unsigned int epoll_flag ; #endif int err ; memset(ev,0,sizeof(mc_event_t)); ev->revent = revent ; ev->ev_fd = fd ; ev->callback = callback ; ev->next = NULL ; ev->prev = NULL ; if( args == NULL ) ev->args = NULL ; else ev->args = args ; /* This job post to mc_event_post *if( revent & MC_EV_LISTEN ) *{ * err = mc_event_add(NULL , ev ); * if( err != 0 ) * fprintf(stderr,"mc_event_add in mc_event_set \n"); *} */ /* event should post to base */ if( ev->base == NULL ) return 0; #if (HAVE_EPOLL) if( revent & MC_EV_READ ) { epoll_flag = EPOLLIN|EPOLLET ; err = mc_event_mod( (void *)&epoll_flag , ev ) ; if( err != 0 ) fprintf(stderr,"mc_event_mod (MC_EVENT_READ ) in mc_event_set in file:%s,line:%d\n",__FILE__,__LINE__); } if( revent & MC_EV_WRITE ) { epoll_flag = EPOLLOUT|EPOLLET ; err = mc_event_mod( (void *)&epoll_flag ,ev ); if( err != 0 ) fprintf(stderr,"mc_event_mod (MC_EVENT_WRITE) in mc_event_set in file:%s,line:%d\n",__FILE__,__LINE__); } ev->ev_flags |= MC_EV_INITD ; #endif return 0 ; } int mc_event_post( mc_event_t *ev , mc_event_base_t * base ) { if( ev == NULL || base == NULL ) { fprintf(stderr," In function mc_event_post , the args error , please check your arguments in file:%s,line:%d\n",__FILE__,__LINE__); return -1; } if( base->magic != MC_BASE_MAGIC ) { fprintf(stderr,"The mc_event_base_t * points base non inited in mc_event_post in file:%s,line:%d\n",__FILE__,__LINE__); return -1; } int err ; ev->base = base ; add_event_to_queue(ev,(mc_event_t **)&(base->added_list)); base->event_num++; err = mc_event_add( NULL , ev ); if( err == -1 ) { fprintf(stderr,"In function mc_event_add error in file:%s,line:%d\n",__FILE__,__LINE__); return -1; } } int mc_dispatch( mc_event_base_t * base ) { if( base == NULL ) { fprintf(stderr, "base == NULL in function mc_dispatch in file:%s,line:%d\n",__FILE__,__LINE__); return -1 ; } if( base->magic != MC_BASE_MAGIC ) { fprintf(stderr,"In function mc_disptahch noinitlized line:%d , in file:%s ",__LINE__,__FILE__); return -1 ; } struct epoll_event *nevents = ( struct epoll_event *)malloc( sizeof( struct epoll_event ) ); int done = 0 ; int nevent ; int i ; mc_event_t *levent ; mc_event_t *retevent ; while( !done ) { nevent = mc_event_loop( nevents , base , base->event_time) ; if( nevent == -1 ) { fprintf(stderr,"No event check , return in file:%s line:%d \n",__FILE__,__LINE__); goto err1; } for( i = 0 ; i < nevent ; i++ ) { if( nevents[i].events & EPOLLERR || nevents[i].events & EPOLLHUP ) { levent = nevents[i].data.ptr ; if( !(levent->ev_flags & MC_EV_INITD) ) continue ; if( (levent->ev_flags & MC_EV_ACTIVE) || (levent->ev_flags & MC_EV_ADDED ) ) del_event_from_queue( levent ); } if( nevents[i].events & EPOLLIN ) { levent = nevents[i].data.ptr ; levent->revent = MC_EV_READ ; add_event_to_queue( levent , (mc_event_t **)&(base->active_list) ); levent->ev_flags |= MC_EV_ACTIVE ; base->event_active_num++; } else if(nevents[i].events & EPOLLOUT) { levent = nevents[i].data.ptr ; levent->revent = MC_EV_WRITE ; add_event_to_queue( levent , (mc_event_t **)&(base->active_list) ); levent->ev_flags |= MC_EV_ACTIVE ; base->event_active_num++; } else { fprintf(stderr,"Unknow err in file:%s,line:%d\n",__FILE__,__LINE__); goto err1; } } retevent = (mc_event_t *)(base->active_list) ; for(i = 0 ;i < nevent ; i++ ) { fprintf(stderr," %d event(s)\n",nevent); if( retevent == NULL ) break ; retevent = get_event_and_del( (mc_event_t *)(base->active_list) ) ; /* If we want to reuse this event we should set event again */ retevent->ev_flags = retevent->ev_flags&(~MC_EV_ACTIVE); base->event_active_num-- ; if( retevent == NULL ) fprintf(stderr,"event is NULL file:%s,line:%d\n",__FILE__,__LINE__); retevent->callback(retevent->ev_fd,retevent->revent,retevent->args) ; } } return 0 ; err1: return -1 ; }
在 dispatch函数中,我们的每一次 epoll 返回后都会轮训 active 事件列表,然后调用事件相应的回调函数。
附上一开头所说的一些宏定义:
#define HAVE_EPOLL 1 #define MC_EV_READ 0x0001 #define MC_EV_WRITE 0x0002 #define MC_EV_SIGNAL 0x0004 #define MC_EV_TIMEOUT 0x0008 #define MC_EV_LISTEN 0x0010 /* the ev_flags value in mc_event_s */ #define MC_EV_INITD 0x0001 #define MC_EV_ADDED 0x0002 #define MC_EV_ACTIVE 0x0004 #define MC_EV_DELED 0x0008 #define MC_BASE_STOP 0x0000 #define MC_BASE_ACTIVE 0x0001 #define MC_BASE_MAGIC 0x1989 #define MC_EVENT_MAX 10240
总结:这篇文章不是那么的完善,涉及的内容太多,希望大家谅解,后续会有更新。
贴出了反应堆的设计方式和简单的思路,仅供参考。系列文章服务器端的模型就到这里。后续可能会写关于在这个模型上不同的知名的软件的设计方式,比如说 libevent的,apache ,Nginx 等。