[原]浅谈几种服务器端模型——反应堆的设计

引言:持续更新了一段时间的博客,今天把最后一点部分加上,一个简单的反应堆的实现,基于epoll,工作过程上一篇博文已经有所介绍。

需要再次提到的就是关于反应堆的使用方式:

注册事件(为需要监听的fd加入回调函数)----->将事件加入反应堆------>开始事件循环------>事件发生,调用回调函数

 

第一次加入的描述符可以为监听描述符,即由 socket() 函数创建,当这个描述符有事件发生,意味着有新的连接的到来,调用回调函数handler_accept() 其中这个函数里面涉及到调用 accept()系统调用和为这个新连接分配实例,然后设置这个连接的回调函数,即 handler_read() handler_write() 等,设置完后相应的连接描述符如果有事件发生,即可以调用相应的不同种事件的回调函数。这个是我们的总体思路,如果需要多进程方式,可以创建多进程,然后每个进程不同的反应堆,但是需要注意的是,如果父子进程共享监听描述符,会引起进程组的惊群现象,就是说,每一个进程都可能会尝试 accept() 这个新的连接,那么这种方式设计的时候需要为 accept() 加锁,具体方式可以看Nginx关于这方面的设计,不仅实现了 accept() 锁,还达到了进程间的负债均衡。

关于连接对象池,可以下次写一篇博文介绍一下对象池的设计方式。

 

言归正传,说说反应堆的设计方式,如果需要方便的话,可以使用libevent..memcached的网络模块就是基于这个,相信大家也知道。

从上上篇关于 epoll 的介绍中就可以看到,事件是整个系统设计的核心,我们的整个反应堆都是围绕一个叫做事件的东西来做相应的处理。

那么,作为应用层的事件,可以这么说来,就是那个地方发生了某件事情,而这个事情是在我们的规定范围的,然后,我们需要知道这个事件给予了我们什么样的权利,比如说,我们可以读,可以写,可以操作等等.

(下面不加说明,都是以 epoll 为例 )

操作系统为我们提供的接口也是类似的操作

创建一个 epoll -----> 注册相应的事件 epoll_ctl() -----> 进入事件循环监听事件(可能超时返回 )epoll_wait() ----->返回事件 ( event_list[i].event && EPOLLIN )等

我们需要做的事情就是,为这个流程的事件做一个封装,并能够有效的管理整个事件,而不是离散的处理。

看看 event的封装:

typedef struct mc_event_s
{
	
	  struct mc_event_s   *next	   ;
	 
	 
	  struct mc_event_s   *prev    ;
	
	 unsigned int min_heap_index  ;
	 
	 int ev_fd		;   // file des of event
	 short revent	;   // event type
	 
	 struct timeval  ev_timeval   ; // event timeout time 
	 mc_ev_callback callback ;// callback of this event 
	 void  *args 			      ;
	 int ev_flags 			      ;
	 
	 mc_event_base_t	*base	  ;
}mc_event_t ;

两个指针分别指向事件的前部和后部,标准的双向队列方式,没什么可说的。

min_heap_index 是作为超时管理的最小堆的下标,目前还没有最这方面的设计,可以先忽略。

ev_fd 是作为这个事件的描述符本身, callback 是注册在事件上的回调函数, ev_flags 是事件的状态,由宏定义为:

#define MC_EV_INITD	   0x0001
#define MC_EV_ADDED    0x0002
#define MC_EV_ACTIVE   0x0004
#define MC_EV_DELED	   0x0008	

状态分为 是否初始化,是否加入了队列,是否加入了激活的队列,已删除。

这里注意的是事件分为两个队列,一个是已加入的,另一个是激活的。我们在处理的时候会将accept()返回的时间加入到已加入的队列,当有事件发生,将这个事件加入到激活的事件队列中,然后依次轮训处理每一个激活的事件。

整个反应堆需要一个控制块,也就是反应堆的实例,结构是像这样:

typedef struct mc_event_base_s
{
	void		 * 	added_list		;
	void	     *	active_list	    ;
	unsigned int 	event_num		;
	unsigned int 	event_active_num;
	
	/*
	 *mc_minheap	    minheap			;
	 */
	int				epoll_fd	    ;  //for epoll only 
	int			    ev_base_stop	;
	int				magic		    ;
	struct timeval	event_time		;	
}mc_event_base_t ;

可以看到,反应堆中维护了两个队列, added_list 和 active_list 为的是能够有效控制所有的事件。

event_num是事件个数, event_active_num 是已激活的事件个数

epoll_fd 是由epoll_create()创建的句柄,这里没有加入宏定义来区分是否操作系统有 epoll

可以这样:

#if (HAVE_EPOLL)

    int   epoll_fd ;

#endif

不同的IO多路复用方式不同,操作句柄也不一样。

ev_base_stop是用来判断是否停止的标志位, magic 被定义为一个宏:

#define MC_BASE_MAGIC  0x1989

用来判断整个反应堆是否初始化。

 

为事件的封装提供了几种操作,初始化,加入队列,删除事件,改变事件类型,循环监听事件。  

然后将struct mc_event_ops 中的函数指针与实际的操作分开,类似于HOOK 方式,这样做的目的是为不同的底层IO多路复用提供了统一的接口,如 select(),epoll(),kqueue()等。

typedef  struct mc_event_ops 
{
	void * (*init)( mc_event_base_t *  )  ;
	int	   (*add)( void * , mc_event_t * );
	int	   (*del)( void * , mc_event_t * );
	int	   (*mod)( void * , mc_event_t * );
	int	   (*dispatch)( void * , mc_event_base_t * ,struct timeval ) ;
}mc_event_opt    ;
	/*
	 * Functions point of events option
	 * there points will point to a instance of function
	 * and other module call there function by ops instance 
	 */




extern mc_event_opt mc_event_op_val ;



#define mc_event_ini  mc_event_op_val.init 
#define mc_event_add  mc_event_op_val.add 
#define mc_event_del  mc_event_op_val.del 
#define mc_event_mod  mc_event_op_val.mod
#define mc_event_loop mc_event_op_val.dispatch

  

看看实际的操作事件方式,我们为这几个操作添加了epoll 的钩子,具体是下面这样:

对应mc_event_ops的第一个钩子

void *mc_epoll_init( mc_event_base_t *meb )
{
	if( meb->magic != MC_BASE_MAGIC )
	{
		fprintf(stderr,"In function mc_epoll_init %d , %s ",__LINE__,__FILE__);
		return NULL ;
	}
	meb->epoll_fd = epoll_create( MC_EVENT_MAX ) ;
	return meb ;
}

方式很简单,调用 epoll_create() 创建一个 epoll 实例,并把这个实例的句柄赋给反应堆。

第二个加入,对应mc_event_ops的第二个钩子

int mc_epoll_add( void * arg ,mc_event_t *ev )
{
	if( ev->base->magic != MC_BASE_MAGIC ) 
	{
		fprintf(stderr,"In function mc_epoll_add %d , %s ",__LINE__,__FILE__);
		return -1 ;
	}
	mc_event_base_t *base = ev->base ;
	int epoll_fd = base->epoll_fd ;
	int err ;
	
	
	struct epoll_event epoll_ev  ;	
	epoll_ev.data.ptr = ev ;
	epoll_ev.events = EPOLLIN|EPOLLET ;
	
	if( !( ev->ev_flags & MC_EV_ADDED ) )
	{
		err = epoll_ctl( epoll_fd , EPOLL_CTL_ADD , ev->ev_fd , &epoll_ev ); 
		if( err != 0 )
		{
			perror("epoll_ctl");
			fprintf(stderr, "In function mc_epoll_add the epoll_ctl error in file:%s,line:%d\n",__FILE__,__LINE__);
			return -1;
		}
		ev->ev_flags |=	MC_EV_ADDED ;
	}
	return 0;
}

具体来说是调用了 epoll_ctl 并设置宏为 EPOLL_CTL_ADD然后设置事件类型

第三个:

int mc_epoll_del( void * arg ,mc_event_t *ev )
{
	if( ev->base->magic != MC_BASE_MAGIC ) 
	{
		fprintf(stderr,"In function mc_epoll_add %d , %s ",__LINE__,__FILE__);
		return -1 ;
	}
	mc_event_base_t *base = ev->base ;
	int epoll_fd = base->epoll_fd ;
	int err ;
	
	if( !(ev->ev_flags & MC_EV_INITD) )
	{
		return -1 ;
	}
	err = epoll_ctl( epoll_fd , EPOLL_CTL_DEL , ev->ev_fd , NULL ); 
	if( err != 0 )
	{
		fprintf(stderr, "In function mc_epoll_del the epoll_ctl error in file:%s,line:%d\n",__FILE__,__LINE__);
		return -1;
	}
	ev->ev_flags = 0x0000 ; 
	
	return 0;
}

第四个:

int mc_epoll_mod(void * arg ,mc_event_t *ev )
{
	if( ev->base->magic != MC_BASE_MAGIC ) 
	{
		fprintf(stderr,"In function mc_epoll_mod %d , %s ",__LINE__,__FILE__);
		return -1 ;
	}
	mc_event_base_t *base = ev->base ;
	int epoll_fd = base->epoll_fd ;
	int err ;
	unsigned int mode ;
	if( !(ev->ev_flags & MC_EV_INITD) )
	{
		return -1 ;
	}
	
	struct epoll_event epoll_ev  ;		
	epoll_ev.data.ptr = ev ;
	if( arg == NULL )
	{
		return 0;
	}
	mode = *(unsigned int *)arg ;
	epoll_ev.events = mode ;
	err = epoll_ctl( epoll_fd , EPOLL_CTL_MOD , ev->ev_fd , &epoll_ev ); 
	if( err != 0 )
	{
		fprintf(stderr, "In function mc_epoll_del the epoll_ctl error in file:%s,line:%d\n",__FILE__,__LINE__);
		return -1;
	}
	return 0;
}

第五个钩子:

int	 mc_epoll_loop( void * args , mc_event_base_t *base , struct timeval ev_time )
{
	if( base == NULL )
	{
		fprintf(stderr,"base == NULL  in mc_epoll_loop in file:%s,line:%d\n",__FILE__,__LINE__);
		return -1 ;
	}
	
	
	if( base->magic != MC_BASE_MAGIC ) 
	{
		fprintf(stderr,"In function mc_epoll_mod %d , %s ",__LINE__,__FILE__);
		return -1 ;
	}
	
	int nfds ; 
	
	/* we pass args as nevents in this function */
	struct epoll_event *nevents = ( struct epoll_event * )args ;
	
	struct epoll_event epoll_ev  ;	
	nfds = epoll_wait(  base->epoll_fd , nevents , MC_EVENT_MAX , 1) ;
	if( nfds <= -1 )
	{
		fprintf(stderr,"epoll wait function in mc_epoll_loop in file:%s,line:%d\n",__FILE__,__LINE__);
		return nfds ;
	}
	return nfds ;
}

实现方式具体可以看相应的代码。文章有点长了,很多代码就不贴出来了。

然后看看最后的一开始提到的几个操作:

 

注册事件(为需要监听的fd加入回调函数)----->将事件加入反应堆------>开始事件循环------>事件发生,调用回调函数

mc_event_base_t * mc_base_new(void)
{
	mc_event_base_t * base = (mc_event_base_t *)malloc( sizeof(mc_event_base_t) );
	if( base == NULL )
	{
		fprintf(stderr,"Init the base moudle in mc_base_new error in file:%s,line:%d\n",__FILE__,__LINE__);
		return NULL ;
	}
	
	/* init the base lists */
	base->added_list = NULL  ;
	base->active_list = NULL ;
	
	base->magic = MC_BASE_MAGIC ;
		
	base->event_num = 0 ; 
	base->event_active_num = 0 ;
	
	base->ev_base_stop = MC_BASE_STOP  ;
	
	base->magic = MC_BASE_MAGIC ;
	
	gettimeofday(&base->event_time,NULL);
	
	mc_event_ini( base ) ;
	return base ;
	
}

int mc_event_set( mc_event_t *ev , short revent , int fd , mc_ev_callback callback , void *args )
{
	if( ev == NULL )
	{
		fprintf(stderr, " mc_event_set error , ev == NULL or other segment error in file:%s,line:%d\n",__FILE__,__LINE__);
		return -1 ;
	}
	#if (HAVE_EPOLL)	
	unsigned int epoll_flag ;
	#endif
	int err ;
	memset(ev,0,sizeof(mc_event_t));
	ev->revent = revent ;
	ev->ev_fd     = fd 	;
	ev->callback = callback ;
	ev->next = NULL ;
	ev->prev = NULL ;
	if( args == NULL )
		ev->args = NULL  ;
	else
		ev->args = args  ;	
	
	/* This job post to mc_event_post 
	 *if( revent & MC_EV_LISTEN )
	 *{
	 *	err = mc_event_add(NULL , ev );
	 *	if( err != 0 )
	 *		fprintf(stderr,"mc_event_add in mc_event_set \n");
	 *}
	 */
	 
	/* event should post to base */
	if( ev->base == NULL )
		return 0;
		
	#if (HAVE_EPOLL)	
	
	
		if( revent & MC_EV_READ )
		{
			epoll_flag = EPOLLIN|EPOLLET ;
		
			err = mc_event_mod( (void *)&epoll_flag , ev ) ;
			if( err != 0 )
				fprintf(stderr,"mc_event_mod (MC_EVENT_READ ) in mc_event_set in file:%s,line:%d\n",__FILE__,__LINE__);
		}
	
		if( revent & MC_EV_WRITE )
		{
			epoll_flag = EPOLLOUT|EPOLLET ;
			err = mc_event_mod( (void *)&epoll_flag ,ev );
			if( err != 0 )
				fprintf(stderr,"mc_event_mod (MC_EVENT_WRITE) in mc_event_set in file:%s,line:%d\n",__FILE__,__LINE__);
		}
	
		ev->ev_flags |= MC_EV_INITD	;
		#endif
	
		return 0 ;
}

int mc_event_post( mc_event_t *ev , mc_event_base_t * base )
{
	if( ev == NULL || base == NULL )
	{
		fprintf(stderr," In function mc_event_post , the args error , please check your arguments in file:%s,line:%d\n",__FILE__,__LINE__);
		return -1;
	}
	if( base->magic != MC_BASE_MAGIC )
	{
		fprintf(stderr,"The mc_event_base_t * points base non inited in mc_event_post in file:%s,line:%d\n",__FILE__,__LINE__);
		return -1;
	}
	int err ;
	ev->base = base ;
	add_event_to_queue(ev,(mc_event_t **)&(base->added_list));
	base->event_num++;
	
	err = mc_event_add( NULL , ev );
	if( err == -1 )
	{
		fprintf(stderr,"In function mc_event_add error in file:%s,line:%d\n",__FILE__,__LINE__);
		return -1;
	}
}



int mc_dispatch( mc_event_base_t * base )
{
	if( base == NULL )
	{
		fprintf(stderr, "base == NULL in function mc_dispatch in file:%s,line:%d\n",__FILE__,__LINE__);
		return -1 ;
	}
	if( base->magic != MC_BASE_MAGIC ) 
	{
		fprintf(stderr,"In function mc_disptahch noinitlized line:%d , in file:%s ",__LINE__,__FILE__);
		return -1 ;
	}
	
	struct epoll_event *nevents = ( struct epoll_event *)malloc( sizeof( struct epoll_event ) );
	int done = 0 ;
	
	int nevent ;
	int i ;
	mc_event_t *levent ;
	mc_event_t *retevent ;
	while( !done )
	{
		nevent = mc_event_loop( nevents , base , base->event_time) ;
		
		if( nevent == -1 )
		{
			fprintf(stderr,"No event check , return in file:%s line:%d \n",__FILE__,__LINE__);
			goto err1;
		}
		for( i = 0 ; i < nevent ; i++ ) 
		{
			if( nevents[i].events & EPOLLERR || nevents[i].events & EPOLLHUP )
			{
				levent = nevents[i].data.ptr ;
				if( !(levent->ev_flags & MC_EV_INITD) )
					continue ;
				if( (levent->ev_flags & MC_EV_ACTIVE) || (levent->ev_flags & MC_EV_ADDED ) )
					del_event_from_queue( levent ); 
			}
			if( nevents[i].events & EPOLLIN )
			{
				levent = nevents[i].data.ptr ;
				levent->revent = MC_EV_READ  ;
				add_event_to_queue( levent , (mc_event_t **)&(base->active_list) );	
				levent->ev_flags |=	MC_EV_ACTIVE ;	
				base->event_active_num++;	
			}
			else if(nevents[i].events & EPOLLOUT)
			{
				levent = nevents[i].data.ptr ;
				levent->revent = MC_EV_WRITE ;
				add_event_to_queue( levent , (mc_event_t **)&(base->active_list) );	
				levent->ev_flags |=	MC_EV_ACTIVE ;	
				base->event_active_num++;
			}
			else
			{
				fprintf(stderr,"Unknow err in file:%s,line:%d\n",__FILE__,__LINE__);
				goto err1;
			}
		}
		
		retevent  = (mc_event_t *)(base->active_list) ;
		for(i = 0 ;i < nevent ; i++ )
		{	
			fprintf(stderr," %d event(s)\n",nevent);
			if( retevent == NULL )
				break ;
		
			retevent = get_event_and_del( (mc_event_t *)(base->active_list) ) ;
			/* If we want to reuse this event we should set event again */
			retevent->ev_flags = retevent->ev_flags&(~MC_EV_ACTIVE);
			base->event_active_num-- ;
			if( retevent == NULL )
				fprintf(stderr,"event is NULL file:%s,line:%d\n",__FILE__,__LINE__);	
	
			retevent->callback(retevent->ev_fd,retevent->revent,retevent->args) ;
		}
		
	}
		return  0 ;
	err1:
		return -1 ;
}

在 dispatch函数中,我们的每一次 epoll 返回后都会轮训 active 事件列表,然后调用事件相应的回调函数。

 

附上一开头所说的一些宏定义:

#define HAVE_EPOLL     1

#define MC_EV_READ	   0x0001
#define MC_EV_WRITE    0x0002
#define MC_EV_SIGNAL   0x0004
#define MC_EV_TIMEOUT  0x0008
#define MC_EV_LISTEN   0x0010

/* the ev_flags value  in mc_event_s */
#define MC_EV_INITD	   0x0001
#define MC_EV_ADDED    0x0002
#define MC_EV_ACTIVE   0x0004
#define MC_EV_DELED	   0x0008	
   

#define MC_BASE_STOP   0x0000
#define MC_BASE_ACTIVE 0x0001

#define MC_BASE_MAGIC  0x1989


#define MC_EVENT_MAX   10240

  

总结:这篇文章不是那么的完善,涉及的内容太多,希望大家谅解,后续会有更新。

贴出了反应堆的设计方式和简单的思路,仅供参考。系列文章服务器端的模型就到这里。后续可能会写关于在这个模型上不同的知名的软件的设计方式,比如说 libevent的,apache ,Nginx 等。  

 

  

  

  

 

 

 

 

 

posted @ 2012-04-26 11:29  _Boz  阅读(4343)  评论(0编辑  收藏  举报
4AI?Z:cp1z?_RJQle1]Gs;P!T)RHroW|