kernel TCP time wait bucket table overflow

 

# 故障描述

有一个需求是实时分析API接口访问日志,提取token去数据库查询对应的uid,然后收集一些指标存入到hbase中。

当程序执行一会后会被系统杀死 Killed ! 

# 故障排查

1、CPU平均负载0.06、内存空闲29G

2、查看系统日志 /var/log/messages

提示:kernel: TCP: time wait bucket table overflow

3、查找资料发现是因为 socket TIME_WAIT 超出了内核设定的上限值

# 解决方法

shell > vim /etc/sysctl.conf

net.ipv4.tcp_fin_timeout = 60       # 如果套接字由本端要求关闭,这个参数决定了它保持在 FIN-WAIT-2 状态的时间,缩短可以减少 TIME_WAIT 状态数量

net.ipv4.tcp_max_tw_buckets = 5000  # TIME_WAIT 数量,超出的部分会被系统删除

net.ipv4.tcp_timestamps = 1         # 该参数与快速回收同时开启且网络环境属于NAT(SLB、LVS)这种情况下会出现问题,切记
net.ipv4.tcp_tw_reuse = 0           # 连接重用,降低 TIME_WAIT 状态数量
net.ipv4.tcp_tw_recycle = 0         # 快速回收 不建议开启,有可能导致无法建立 TCP 连接

net.ipv4.ip_local_port_range = 32768 60999  # 本地可用端口范围,增加会使服务器可以建立更多的连接,增加吞吐量

# 所以优化的结果如下:

net.ipv4.tcp_fin_timeout = 30
net.ipv4.tcp_max_tw_buckets = 32768
net.ipv4.tcp_tw_reuse = 1
net.ipv4.ip_local_port_range = 10240 60999

 

posted @ 2018-01-25 18:55  WangXiaoQiang  阅读(748)  评论(0编辑  收藏  举报