TCP三次握手和四次挥手

　　TCP的连接建立和断开大学的课程也都学过，这里不做探讨，只是一个基础知识的回顾。

1、网络模型

　　OSI七层网络模型：应用层、表示层、会话层、传输层、网络层、数据链路层、物理层。

　　五层网络模型：应用层（对应七层的前三层）、传输层、网络层、数据链路层、物理层。

　　TCP/IP四层网络模型：应用层（对应七层的前三层）、传输层、网络层、数据链路层（对应七层的后两层）。四层网络模型更加侧重互联网通信核心（也就是围绕TCP/IP相关的协议）的分层，因此没有物理层，以及其他不相关的协议。

2、三次握手

　　所谓三次握手（Three-Way Handshake）即建立TCP连接，就是指建立一个TCP连接时，需要客户端和服务端总共发送3个包以确认连接的建立。在socket编程中，这一过程由客户端执行connect来触发，整个流程如下图所示：

　　（1）第一次握手：Client将标志位SYN置为1，随机产生一个值seq=J，并将该数据包发送给Server，Client进入SYN_SENT状态，等待Server确认。

　　（2）第二次握手：Server收到数据包后由标志位SYN=1知道Client请求建立连接，Server将标志位SYN和ACK都置为1，ack=J+1，随机产生一个值seq=K，并将该数据包发送给Client以确认连接请求，Server进入SYN_RCVD状态。

　　（3）第三次握手：Client收到确认后，检查ack是否为J+1，ACK是否为1，如果正确则将标志位ACK置为1，ack=K+1，并将该数据包发送给Server，Server检查ack是否为K+1，ACK是否为1，如果正确则连接建立成功，Client和Server进入ESTABLISHED状态，完成三次握手，随后Client与Server之间可以开始传输数据了。

问题1：为什么客户端还要最后还要发送一次确认呢？

　　答：主要防止已经失效的连接请求报文突然又传送到了服务器，从而产生错误。

　　如果使用的是两次握手建立连接，假设有这样一种场景，客户端发送了第一个请求连接并且没有丢失，只是因为在网络结点中滞留的时间太长了，由于TCP的客户端迟迟没有收到确认报文，以为服务器没有收到，此时重新向服务器发送这条报文，此后客户端和服务器经过两次握手完成连接，传输数据，然后关闭连接。此时此前滞留的那一次请求连接，网络通畅了到达了服务器，这个报文本该是失效的，但是，两次握手的机制将会让客户端和服务器再次建立连接，这将导致不必要的错误和资源的浪费。如果采用的是三次握手，就算是那一次失效的报文传送过来了，服务端接受到了那条失效报文并且回复了确认报文，但是客户端不会再次发出确认。由于服务器收不到确认，就知道客户端并没有请求连接。

问题2：DDOS攻击之SYN网络攻击

　　答：在三次握手过程中，Server发送SYN-ACK之后，收到Client的ACK之前的TCP连接称为半连接（half-open connect），此时Server处于SYN_RCVD状态，当收到ACK后，Server转入ESTABLISHED状态。SYN攻击就是Client在短时间内伪造大量不存在的IP地址，并向Server不断地发送SYN包，Server回复确认包，并等待Client的确认，由于源地址是不存在的，因此，Server需要不断重发直至超时，这些伪造的SYN包将产时间占用未连接队列，导致正常的SYN请求因为队列满而被丢弃，从而引起网络堵塞甚至系统瘫痪。SYN攻击时一种典型的DDOS攻击，检测SYN攻击的方式非常简单，即当Server上有大量半连接状态且源IP地址是随机的，则可以断定遭到SYN攻击了，使用如下命令可以让之现行：

#netstat -nap | grep SYN_RECV

3、TCP四次挥手

　　所谓四次挥手（Four-Way Wavehand）即终止TCP连接，就是指断开一个TCP连接时，需要客户端和服务端总共发送4个包以确认连接的断开。在socket编程中，这一过程由客户端或服务端任一方执行close来触发，整个流程如下图所示：

　　这里不要把client/server和服务中的客户端和服务端搞混，主动发起的一方就是client。

　　由于TCP连接时全双工的，因此，每个方向都必须要单独进行关闭，这一原则是当一方完成数据发送任务后，发送一个FIN来终止这一方向的连接，收到一个FIN只是意味着这一方向上没有数据流动了，即不会再收到数据了，但是在这个TCP连接上仍然能够发送数据，直到这一方向也发送了FIN。首先进行关闭的一方将执行主动关闭，而另一方则执行被动关闭，上图描述的即是如此。

　　（1）第一次挥手：Client发送一个FIN，用来关闭Client到Server的数据传送，Client进入FIN_WAIT_1状态。(状态位FIN=1,发送seq=J)

　　（2）第二次挥手：Server收到FIN后，发送一个ACK给Client，确认序号为收到序号+1（与SYN相同，一个FIN占用一个序号），Server进入CLOSE_WAIT状态。(状态位ACK=1，发送ack=J+1)

　　（3）第三次挥手：Server发送一个FIN，用来关闭Server到Client的数据传送，Server进入LAST_ACK状态。(状态位FIN=1,发送seq=K)

　　（4）第四次挥手：Client收到FIN后，Client进入TIME_WAIT状态，接着发送一个ACK给Server，确认序号为收到序号+1，Server进入CLOSED状态，完成四次挥手。(状态位ACK=1，ack=K+1)

　　注意此时客户端并未进入CLOSED状态，为了防止服务延迟，需要等待2MSL的时间，然后进入CLOSED状态，因为如果客户端直接进入CLOSED了，如果网络异常，客户端就不能重重发数据。

　　MSL：Maximum Segment Lifetime 报文最大生存时间，它是任何报文在网络上存在的最长时间，超过这个时间报文将被丢弃。

问题1：为什么TIME_WAIT状态需要经过2MSL(最大报文段生存时间)才能返回到CLOSE状态？

　　答：原因有二：

　　　　一、保证TCP协议的全双工连接能够可靠关闭
　　　　二、保证这次连接的重复数据段从网络中消失

　　先说第一点，如果Client直接CLOSED了，那么由于IP协议的不可靠性或者是其它网络原因，导致Server没有收到Client最后回复的ACK。那么Server就会在超时之后继续发送FIN，此时由于Client已经CLOSED了，就找不到与重发的FIN对应的连接，最后Server就会收到RST而不是ACK，Server就会以为是连接错误把问题报告给高层。这样的情况虽然不会造成数据丢失，但是却导致TCP协议不符合可靠连接的要求。所以，Client不是直接进入CLOSED，而是要保持TIME_WAIT，当再次收到FIN的时候，能够保证对方收到ACK，最后正确的关闭连接。

　　再说第二点，如果Client直接CLOSED，然后又再向Server发起一个新连接，我们不能保证这个新连接与刚关闭的连接的端口号是不同的。也就是说有可能新连接和老连接的端口号是相同的。一般来说不会发生什么问题，但是还是有特殊情况出现：假设新连接和已经关闭的老连接端口号是一样的，如果前一次连接的某些数据仍然滞留在网络中，这些延迟数据在建立新连接之后才到达Server，由于新连接和老连接的端口号是一样的，又因为TCP协议判断不同连接的依据是socket pair，于是，TCP协议就认为那个延迟的数据是属于新连接的，这样就和真正的新连接的数据包发生混淆了。所以TCP连接还要在TIME_WAIT状态等待2倍MSL，这样可以保证本次连接的所有数据都从网络中消失。

问题2：为什么建立连接是三次握手，而关闭连接却是四次挥手呢？

　　答：因为服务端在LISTEN状态下，收到建立连接请求的SYN报文后，把ACK和SYN放在一个报文里发送给客户端。而关闭连接时，当收到对方的FIN报文时，仅仅表示对方不再发送数据了但是还能接收数据，己方也未必全部数据都发送给对方了，所以己方可以立即close，也可以发送一些数据给对方后，再发送FIN报文给对方来表示同意现在关闭连接，因此，己方ACK和FIN一般都会分开发送。

问题3：CLOSE_WAIT问题排查

　　线上数据库事务未关闭导致大量close_wait，从而造成socket资源被打满

场景：

　　现象：有用户反馈提现不到账，查看订单列表发现从凌晨3点到现在有很多订单打款失败，拿到失败订单ID查看日志发现审核失败，原因是请求服务器被拒。

　　调用链路：user-event用户行为服务，在商城服务中配置订单审核回调接口（各项目业务方自己定义）用于订单个性化审核，业务方根据一些大额订单（师徒订单）进行用户行为（主要是行为打点数据）分析作为订单审核依据，会调用user-event获取用户打点行为数据。

　　排查具体原因：在grafana上查看user-event服务发现socket连接数增长很多（从500-960），开始怀疑请求量增大，但是发现qps没有太大波动，然后登录user-event服务器通过natstat查看网络状态发现大量MySQL连接处于close_wait状态，然后去排查昨天上线的需求，发现在处理昨天有提现但是非昨天注册的用户不应该迁移，但是修改了状态后没有回滚事务。

　　原理：由于代码没有对事务进行回滚，导致服务端没有主动发起close。因此 MySQL负载均衡器 在达到 60s 的时候主动触发了close操作，但服务端并没有进行回应，这是因为代码中的事务没有处理，因此从而导致大量的端口、连接资源被占用。

posted @ 2022-02-21 20:04 jingyi_up 阅读(63) 评论(0) 收藏举报

刷新页面返回顶部

jingyi_up

TCP三次握手和四次挥手

1、网络模型

2、三次握手

3、TCP四次挥手

公告