nginx服务器中出现过多TIME_WAIT的问题
在允许nginx服务器中,输入命令:
netstat -ano | grep "TIME_WAIT"
可以看到出现很多TIME_WAIT的端口,
输入命令:
netstat -an|awk '/tcp/ {print $6}'|sort|uniq -c
可以看到结果:
76 CLOSE_WAIT
354 ESTABLISHED
1 FIN_WAIT2
9 LISTEN
31 SYN_SENT
4664 TIME_WAIT
TIME_WAIT产生原因分析:
- nginx、tomcat等使用短链接方式时,可能会产生大量 TIME_WAIT 状态的网络连接。这是因为在 HTTP 请求过程中,客户端(如浏览器)和服务器之间会创建多个 TCP 连接。当请求完成时,这些连接需要关闭以释放资源。在 TCP/IP 协议中,当一个 TCP 连接被关闭时,会有一个 TIME_WAIT 状态,以确保接收方已正确接收到数据确认。这个状态会在收到确认之后变为 TIME_WAIT 状态,等待一定时间后自动超时并释放。但与服务器nginx、tomcat链接的客户端数量比较多的时候,也就可能导致出现大量处于TIME_WAIT状态的连接。
- TCP/IP协议本身设计也会出现TIME_WAIT,如TCP挥手释放链接的阶段:当一次TCP连接结束时,主动关闭的一方需要等待一段时间(通常为2MSL,即最大报文生存时间)以确保对方接收到关闭通知。这段时间就是TIME_WAIT状态。在这个状态下,如果收到一个新的连接请求,旧连接的客户端会发送一个RST包给服务器,告知它现在正在处理新的连接。
TIME_WAIT可能产生的影响:
TIME_WAIT并不会占用很大资源,除非受到攻击,只要把TIME_WAIT所占内存控制在一定范围就行。一般系统默认最大是35600条TIME_WAIT。
避免过多TIME_WAIT的方法
修改配置/etc/sysctl.conf :
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 0
net.ipv4.tcp_fin_timeout = 30
net.ipv4.tcp_syn_retries = 5
net.ipv4.tcp_synack_retries = 5
net.ipv4.tcp_keepalive_time = 1200
net.ipv4.ip_local_port_range = 1024 65000
net.ipv4.tcp_max_syn_backlog = 8192
net.ipv4.tcp_max_tw_buckets = 5000
net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;
net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;
net.ipv4.tcp_tw_recycle = 0 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。开启为1,会造成网络连接不稳定,慎重开启
net.ipv4.tcp_fin_timeout = 30 表示如果套接字由本端要求关闭,这个参数决定了它保持在FIN-WAIT-2状态的时间。
net.ipv4.tcp_keepalive_time = 1200 表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。
net.ipv4.ip_local_port_range = 1024 65000 表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。
net.ipv4.tcp_max_syn_backlog = 8192 表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。
net.ipv4.tcp_max_tw_buckets = 5000 表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。默认为180000,改为5000。对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。
注:
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 0
设置这两个参数: reuse是表示是否允许重新应用处于TIME-WAIT状态的socket用于新的TCP连接; recyse是加速TIME-WAIT sockets回收