工作学习1-tcp自连接
运维同事反馈服务起不来。下面为了方便,写了一个demo来展示。
https://gitee.com/northeast_coder/code/tree/master/case/case1_tcp_self_con
1、调查问题
查问题先看软件日志,报错日志提示监听管理公开i的port被占用,无法建立监听。
root
err!file:../../../xcom/xsock.hpp,line:51,last err=98 Address already in use
err!file:main.cpp,line:19,last err=98 Address already in use
根据提示,ss命令看了一下,谁占用了端口
root@DESKTOP-JS5DDL9:~$ ss -apn|grep 40000
tcp ESTAB 0 0 127.0.0.1:40000 127.0.0.1:40000 users:(("client",pid=275,fd=3))
有一条怪异的连接,local addr和 peer addr居然相同,都是服务要监听的地址。client是管理工具,是connect端,连接服务的,怎么连上自己了呢?原来这里触发了“tcp自连接”
2、分析原因
正常tcp连接
#监听端 bind,listern;
#连接端:connect
#监听端:accept
也就是大名鼎鼎的三次握手过程
1、con:syn
2、srv:syn+ack
3、con:ack
非正常tcp连接(simultaneous open)
学习时尽量要找到一手材料,在 RFC-793 Section 3.4, page 32定义了这种同时打开的情况。rfc793 (ietf.org)
自连接是simultaneous open比较特殊的情况,每次连接时os会给本地随机有一个port,服务没有启动,所以不断重连,当随机的port恰好为服务的port时,则client本地地址为0.0.0.0:40000,目标也是0.0.0.0:40000,达成了simultaneous open的条件,触发了自连接,占用了服务端的端口。
3、问题解决
#检测自连接
连接端:连接成功后,获取对端地址以及本地地址,若相同则主动断开。
#修改服务端监听端口
连接端随机端口有个范围,修改监听地址不在此范围即可。
cat /proc/sys/net/ipv4/ip_local_port_range
32768 60999
全网同名(腾讯&字节&博客园)欢迎关注~