boost::asio::detail::epoll_reactor::start_op的崩溃问题
在对程序进行压力测试时发现,程序有概率会在boost::asio::detail::epoll_reactor::start_op上面奔溃
尤其是在并发数较高的情况下。
查看boost中epoll_reactor.ipp中的源码,对奔溃处的逻辑进行分析后发现其基本逻辑如下:
对于每个socket链接,在程序调用停止函数对socket对象进行关闭或者销毁时
会在reactive_socket_service_base::destroy/close调用epoll_reactor::deregister_descriptor函数
注销相应的descriptor
在注销时,首先会判断descriptor_data是否为空,若为空则直接返回,若不为空则使用mutex进行加锁。
之后,使用descriptor_data中的shutdown_字段判断是否是已关闭状态。
若正常便进行相应处理逻辑。在处理完成之后会将descriptor_data置为空。
那么问题就在于在多线程高并发的情况,判断descriptor_data是否为空和加锁这一步骤中,descriptor_data可能会被其他线程置为空
导致之后使用descriptor_data中的shutdown_字段判断时,造成segment fault。使得该函数不是线程安全的函数。
解决方案:使用mutex使得不同线程不会同时对一个socket连接进行关闭操作。