Nginx平滑升级源码分析

一、平滑升级步骤

1、重命名之前的sbin/nginx文件,将新的nginx文件放到sbin/目录下

#mv ./sbin/nginx ./sbin/nginx.old

#cp ~/nginx ./sbin/

2、向正在运行的nginx发送USR2信号启动新的nginx,这个时候新老nginx都会接收请求,看那一个进程能抢到锁,抢到锁的worker进程可以accpet新请求

#kill -USR2  `cat nginx.pid`

3、观察新的nginx运行无误后,向旧nginx发信号 停止旧nginx的运行

#kill -QUIT `cat nginx.pid.oldbin`

 

 

二、源码分析

1,nginx启动时 设置信号监听函数,监听信号

src/core/nginx.c  

NewImage

368行 ngx_init_signals函数 设置要监听的信号,和信号的处理函数

 

src/core/nginx.c  

NewImage

291-293行 信号为sig->signo,对应的处理函数为sig->handler

 

sig的定义如下

NewImage

QUIT和USR2的信号处理函数都为 ngx_signal_handler

对应的流程图为

NewImage

 

 

2、master进程通过sigsuspend挂起在信号监听处

NewImage

 

3,向master进程id发送USR2信号

ngx_signal_handler处理USR2信号

src/os/unix/ngx_process.c

NewImage

372行  设置了ngx_change_binary=1

 

master进程接收到信号,从挂起状态恢复,继续执行

src/os/unix/ngx_process.c

NewImage

277行 ngx_exec_new_binary通过fork启动新的nginx bin文件

 

src/core/nginx.c

NewImage

589行 ngx_set_evviroment 设置新nginx bin的环境变量

640行 ngx_rename_file 通过rename函数将nginx.pid文件重命名为nginx.pid.oldbin

651行 ngx_execute 启动新的bin文件

由于nginx老master进程fork出的新nginxmaster进程,他们可以监听同一个端口,所以新nginx和老nginx可以同时监听端口,具体谁执行看哪一个worker子进程抢到了锁,可以accpet新连接 

 

src/os/unix/ngx_process.c

NewImage

src/os/unix/ngx_process.c

NewImage

src/os/unix/ngx_process.c

 

对应的流程图如下

 

NewImage

 

4、向老的nginx进程发送QUIT信号,从容关闭

master进程收到QUIT信号后,将ngx_quit置为1

NewImage

master进程接收到信号,从挂起状态恢复,继续执行

NewImage

209行 ngx_signal_worket_processes 向worker进程发送 NGX_SHUTDOWN_SIGNAL(QUIT)信号

215行 ngx_close_socket 主进程关闭监听的socket

 

src/os/unix/ngx_process_cycle.c

NewImage

504行 通过kill函数向所有worker进程发送信号

 

5、worker进程收到NGX_SHUTDOWN_SIGNAL(QUIT)信号

src/os/unix/ngx_process.c 

NewImage

360行 worker进程将ngx_quit置为1

NewImage

worker进程收到信号后从epoll_wait中唤醒从ngx_process_events_and_timers函数中恢复,

710-714行 发现ngx_quit=1后将ngx_quit恢复为0,ngx_exiting置为1,

713行 通过ngx_close_listening_sockets关闭处理的socket

609行 下一次循环发现ngx_exiting=1后,处理队列中的已有事件和超时事件,发现没有要处理的事件了,就通过ngx_worker_process_exit退出worker进程

 

src/os/unix/ngx_process_cycle.c

NewImage

1024行 调用各个模块的exit_process方法

1067行 销毁内存池

对应的流程图如下

NewImage 

 

6、子进程退出后,作为父进程的master进程会收到SIGCHLD信号

src/os/unix/ngx_process.c

NewImage

387行 父进程收到SIGCHLD后将ngx_reap置为1,

437行 发现信号是SIGCHLD后执行ngx_process_get_status函数判断worker子进程是正常退出,还是异常退出

 

src/os/unix/ngx_process.c

NewImage

494-499行 如果发现worker子进程如果是正常退出的,会将exited置为1

 

master进程接收到信号,从挂起状态恢复,继续执行

NewImage

176行 发现ngx_reap=1后,ngx_reap_children函数判断是否需要重启worker进程

如果worker是因为收到了quit信号正常退出的,所有worker进程退出时,live=0

183行 live=0 并且收到了ngx_quit信号  通过ngx_master_process_exit关闭master进程

 

src/os/unix/ngx_process_cycle.c

NewImage

619 如果worker至今才是因为意外退出的,并且可以重启,则调用ngx_spawn_process重新启动一个worker子进程

642 如果有worker进程还在运行则live=1 如果全部的worker子进程都已经退出则live=0

 

src/os/unix/ngx_process_cycle.c

NewImage

656行 ngx_delete_pidfile 删除pid文件

666行 ngx_close_listening_sockets 关闭监听端口

685行 销毁内存池

686行 退出

对应的流程图如下

NewImage

 

posted on 2017-10-12 23:33  magicsoar  阅读(2101)  评论(1编辑  收藏  举报

导航