[phvia/firman] PHP多进程服务器模型中的惊群
[ 典型场景 ]
典型的多进程服务器模型是这样的,主进程绑定ip,监听port,fork几个子进程,子进程安装信号处理器,随后轮询资源描述符检查是否可读可写;
子进程的轮询又涉及到 IO复用,accept连接,事件处理 系列操作。
以下用伪码表示这个过程:
Master: bind -> listen -> fork { // Child install signal select loop accept connection event callback } -> monitor
[ 存在缺陷 ]
主进程监听port,存在惊群问题,客户端连接请求到来时,所有子进程被唤醒,尝试接受连接,但只有一个连接成功,其余产生EAGAIN错误,并继续进入轮询。
通过 strace -p pid 可以看到空闲进程的执行过程:
$ select(7, [6], [6], [], {5, 0}) = 0 (Timeout) $ select(7, [6], [6], [], {5, 0}) = 1 (in [6], left {2, 22060}) $ poll([{fd=6, events=POLLIN|POLLERR|POLLHUP}], 1, 10000) = 1 ([{fd=6, revents=POLLIN}]) $ accept(6, 0x7ffe34ffe390, 0x7ffe34ffe380) = -1 EAGAIN (Resource temporarily unavailable) $ poll([{fd=6, events=POLLIN|POLLERR|POLLHUP}], 1, 10000) = 0 (Timeout) $ select(7, [6], [6], [], {5, 0}) = 0 (Timeout)
可想而知,当子进程数量较多时,进程调度(上下文切换)需要耗费的资源非常多。
[ 解决方式 ]
在PHP7,启用 socket 的 so_reuseport 选项之后,子进程就可以在每个端口上监听了,有连接时才被唤醒。
以下用伪码表示这个过程:
Master: fork { // Child install signal bind listen select loop accept connection event callback } -> monitor
[ 框架应用 ]
phvia/firman(https://github.com/phvia/firman/commit/bace0b2ffda915cc8cf5c73dc009d78a215637d3)
Refer:PHP多进程模型
Course:PHP高并发编程