nginx中时间的管理
因为nginx採用的是master-workers多进程的方式。每一个一进程都会自己维护一个时间缓存。那么在nginx中什么时候会更新时间缓存呢?上面说到nginx採用了2种方式来维护时间,首先来介绍没实用timer_resolution指令设置时间精度的情况。也就是ngx_timer_resolution为0的情况,实际上仅仅要找一下ngx_time_update()和ngx_time_sigsafe_update()这两个函数被调用的位置就知道。首先来说一下ngx_time_sigsafe_update(),它比較简单仅仅是更新了ngx_cached_err_log_time。它会在每次运行信号处理函数的时候被调用,也就是在ngx_signal_handler()函数中。ngx_time_update()函数在master进程中的ngx_master_process_cycle()主循环中被调用。详细位置为sigsuspend()函数之后。也就是说master进程捕捉到并处理完一个信号返回的时候会更新时间缓存;在worker进程中,ngx_time_update函数的调用链为ngx_worker_process_cycle() -> ngx_process_events_and_timers() -> ngx_process_events() -> ngx_time_update(), 当中ngx_process_events()实际上一个宏,nginx中定义例如以下:
#define ngx_process_events ngx_event_actions.process_events
而ngx_event_actions为nginx的I/O模型接口函数结构体。封装如epoll, kqueue,select,poll等这些提供的接口,这里仅对epoll进行分析,其它类似。于是ngx_event_actions.process_events 相应ngx_epoll_module.c文件里的 ngx_epoll_process_events()函数,在这个函数中运行epoll_wait()返回后会调用ngx_time_update()更新时间缓存,也就是当epoll通知有事件到达或者epoll超时返回后会更新一次时间;最后在cache_manager的进程也调用ngx_time_update()维护自己的时间缓存,这里不做介绍。
另外一种方式,ngx_timer_resolution被设置为大于0,也就是说。此时nginx的时间缓存精确到ngx_timer_resolution毫秒,详细的实现方法是在event模块的初始化函数ngx_event_process_init()中调用了setitimer()函数,它每隔ngx_timer_resolution毫秒会产生一个SIGALRM信号,这个信号的处理函数为ngx_timer_signal_handler(),定义例如以下:
ngx_timer_signal_handler(int signo)
{
ngx_event_timer_alarm = 1;
#if 1
ngx_log_debug0(NGX_LOG_DEBUG_EVENT, ngx_cycle->log, 0, "timer signal");
#endif
}
它很easy,仅仅是将ngx_event_timer_alarm设置为1,用来记录有SIGALRM信号发生了,这时在来看ngx_epoll_process_events()函数。epoll_wait()的timeout被设置为-1。假设epoll_wait()是被SIGALRM信号唤醒。则调用ngx_time_update()更新时间缓存,否则继续使用之前的时间缓存。由于setitimer()每隔ngx_timer_resolution毫秒总会产生一次SIGALRM信号,这样就保证了时间缓存的精度为ngx_timer_resolution毫秒。这里仅仅介绍了worker进程的情况。其它进程类似。
ngx_time_update()和ngx_time_sigsafe_update()这两个函数的实现比較简单。可是还是有几个值得注意的地方。首先由于时间可能在信号处理中被更新,另外多线程的时候也可能同一时候更新时间(nginx如今尽管没有开放多线程。可是代码中有考虑),nginx使用了原子变量ngx_time_lock来对时间变量进行写加锁,并且nginx考虑到读时间的操作比較多。出于性能的原因没有对读进行加锁。而是採用维护多个时间slot的方式来尽量降低读訪问冲突。基本原理就是,当读操作和写操作同一时候发生时(1,多线程时可能发生。2,当进程正在读时间缓存时。被一信号中断去运行信号处理函数。信号处理函数中会更新时间缓存),也就是读操作正在进行时(比方刚拷贝完ngx_cached_time->sec,或者拷贝ngx_cached_http_time.data进行到一半时),假设写操作改变了读操作的时间。读操作终于得到的时间就变混乱了。nginx这里採用了64个slot时间,也就是每次更新时间的时候都是更新下一个slot。假设读操作同一时候进行,读到的还是之前的slot,并没有被改变,当然这里仅仅能是尽量降低了时间混乱的几率。由于slot的个数不是无限的。slot是循环的。写操作总有几率会写到读操作的slot上。只是nginx如今实际上并没有採用多线程的方式,并且在信号处理中仅仅是更新cached_err_log_time。所以对其它时间变量的读訪问是不会发生混乱的。 还有一个地方是两个函数中都调用了 ngx_memory_barrier() ,实际上这个也是一个宏,它的详细定义和编译器及体系结构有关,gcc和x86环境下,定义例如以下:
#define ngx_memory_barrier() __asm__ volatile ("" ::: "memory")
它的作用实际上还是和防止读操作混乱有关,它告诉编译器不要将其后面的语句进行优化。不要打乱其运行顺序,详细还是来看一下 ngx_time_update函数:
ngx_time_update()
{
...
if (!ngx_trylock(&ngx_time_lock)) {
return;
}
...
tp = &cached_time[slot];
tp->sec = sec;
tp->msec = msec;
ngx_gmtime(sec, &gmt);
p0 = &cached_http_time[slot][0];
(void) ngx_sprintf(p0, "%s, %02d %s %4d %02d:%02d:%02d GMT",
week[gmt.ngx_tm_wday], gmt.ngx_tm_mday,
months[gmt.ngx_tm_mon - 1], gmt.ngx_tm_year,
gmt.ngx_tm_hour, gmt.ngx_tm_min, gmt.ngx_tm_sec);
#if (NGX_HAVE_GETTIMEZONE)
tp->gmtoff = ngx_gettimezone();
ngx_gmtime(sec + tp->gmtoff * 60, &tm);
#elif (NGX_HAVE_GMTOFF)
ngx_localtime(sec, &tm);
cached_gmtoff = (ngx_int_t) (tm.ngx_tm_gmtoff / 60);
tp->gmtoff = cached_gmtoff;
#else
ngx_localtime(sec, &tm);
cached_gmtoff = ngx_timezone(tm.ngx_tm_isdst);
tp->gmtoff = cached_gmtoff;
#endif
p1 = &cached_err_log_time[slot][0];
(void) ngx_sprintf(p1, "%4d/%02d/%02d %02d:%02d:%02d",
tm.ngx_tm_year, tm.ngx_tm_mon,
tm.ngx_tm_mday, tm.ngx_tm_hour,
tm.ngx_tm_min, tm.ngx_tm_sec);
p2 = &cached_http_log_time[slot][0];
(void) ngx_sprintf(p2, "%02d/%s/%d:%02d:%02d:%02d %c%02d%02d",
tm.ngx_tm_mday, months[tm.ngx_tm_mon - 1],
tm.ngx_tm_year, tm.ngx_tm_hour,
tm.ngx_tm_min, tm.ngx_tm_sec,
tp->gmtoff < 0 ? '-' : '+',
ngx_abs(tp->gmtoff / 60), ngx_abs(tp->gmtoff % 60));
ngx_memory_barrier();
ngx_cached_time = tp;
ngx_cached_http_time.data = p0;
ngx_cached_err_log_time.data = p1;
ngx_cached_http_log_time.data = p2;
ngx_unlock(&ngx_time_lock);
}
能够看到ngx_memory_barrier()之后是四条赋值语句。假设没有ngx_memory_barrier()。编译器可能会将ngx_cached_time = tp,ngx_cached_http_time.data = p0。ngx_cached_err_log_time.data = p1, ngx_cached_http_log_time.data = p2分别和之前的tp = &cached_time[slot], p0 = &cached_http_time[slot][0], p1 = &cached_err_log_time[slot][0], p2 = &cached_http_log_time[slot][0]合并优化掉,这种后果是ngx_cached_time,ngx_cached_http_time,ngx_cached_err_log_time, ngx_cached_http_log_time这四个时间缓存的不一致性时长增大了,由于在最后一个ngx_sprintf运行完后这四个时间缓存才一致,在这之前假设有其它地方正在读时间缓存就可能导致读到的时间不对或者不一致。而採用ngx_memory_barrier()后。时间缓存更新到一致的状态仅仅须要几个时钟周期。由于仅仅有四条赋值指令,显然在这么短的时间内发生读时间缓存的概率会小的多了。从这里能够看出Igor考虑是很仔细的。