(二十九)运输层--TCP的运输连接管理
TCP的运输连接管理
TCP是面向连接的协议。运输连接是用来传送TCP报文的。TCP运输连接的建立和释放是每一次面向连接的通信中必不可少的过程。因此,运输连接就有三个阶段,即:连接建立、数据传送、连接释放。运输连接的管理就是使运输连接的建立和释放都能正常的进行。
在TCP连接建立过程中要解决以下三个问题:
(1)要使每一方能够确知对方的存在
(2)要双方协商一些参数(如最大窗口值、是否使用窗口扩大选项和时间戳选项以及服务质量等)
(3)能够对运输实体资源进行分配(如缓存大小、连接表中的项目等)
TCP连接的建立采用客户服务器方式。主动发起连接建立的应用进程叫做客户,而被动等待连接建立的应用进程叫做服务器。
TCP的连接建立
TCP建立连接的过程叫做握手,握手需要在客户和服务器之间交换3个TCP报文段,下图是三报文握手建立TCP连接的过程。
假定主机A运行的是TCP客户程序,而B运行TCP服务器程序。最初两端的TCP进程都处于 CLOSED(关闭) 状态。图中在主机下面的方框分别是TCP进程所处的状态。请注意,在本例中,A主动打开连接,B被动打开连接。
一开始,B的TCP服务器进程先创建传输控制块TCB。准备接受客户进程的连接请求。然后服务器进程就处于 LISTEN(收听)状态,等待客户的连接请求。如有,即作出响应。
A的TCP客户进程也是首先创建传输控制模块TCB。然后,在打算建立TCP连接时,向B发出连接请求报文段,这时首部中的同步位 SYN = 1,同时选择一个初始序号 seq = x。TCP规定,SYN 报文段(即SYN = 1 的报文段)不能携带数据,但要消耗掉一个序号。这时,TCP客户进程进入 SYN-SENT (同步已发送)状态。
B收到连接请求报文段后,如同意建立连接,则向A发送确认。在确认报文段中应把 SYN 位和 ACK 位都置1,确认号 ack = x + 1,同时也为自己选择一个初始序号 seq = y。请注意,这个报文段也不能携带数据,但同样要消耗掉一个序号。这时TCP服务器进程进入 SYN-RCVD (同步收到)状态。
TCP客户进程收到B的确认后,还要向B给出确认。确认报文段的ACK置1,确认号ack = y + 1。这时,TCP连接已经建立,A进入 ESTABLISHED(已建立连接)状态。
当B收到A的确认后,也进入 ESTABLISHED 状态。
上面给出的连接建立过程叫做三报文握手。B发送给A的报文段,也可拆成两个报文段。可以先发送一个确认报文段(ACK = 1,ack = x + 1),然后再发送一个同步报文段(SYN = 1,seq = y)。这样的话,就变成了四报文握手,但效果是一样的。
为什么A最后还要发送一次确认呢?这主要是为了防止已失效的连接请求报文突然又传到了B。因而产生错误。“已失效的连接请求报文段”是这样产生的。考虑一种正常情况,A发出连接请求,但因连接请求报文丢失而未收到确认。于是A再重传一次连接请求。后来收到了确认,建立了连接。数据传输完毕后,就释放了连接。A共发送了两个连接请求报文段,其中第一个丢失,第二个到达了B。
现假定出现一种异常情况,即A发出的第一个连接请求报文段并没有丢失,而是在某些网络结点长时间滞留了,以致延误到连接释放以后的某个时间才到达B。本来这是一个早已失效的报文段。但B收到此失效的连接请求报文段后,就误以为是A又发出一次新的连接请求。于是就向A发出确认报文段,同意建立连接。假定不采用第三次报文握手,那么只要B发出确认,新的连接就建立了。
由于现在A并没有发出建立连接的请求,因此不会理睬B的确认,也不会向B发送数据。但B却以为新的运输连接已经建立了,并一直等待A发来数据。B的许多资源就这样白白浪费了。
采用三报文握手的办法,可以防止上述现象的发生。例如在刚才的异常情况下,A不会向B的确认发出确认。B由于收不到确认,就知道A并没有要求建立连接。
TCP的连接释放
数据传输结束后,通信的双方都可释放连接。现在A和B都处于 ESTABLISHED 状态。A的应用进程先向其TCP发出连接释放报文段,并停止再发送数据,主动关闭TCP连接。A把连接释放报文段首部的终止控制位 FIN 置1,其序号 seq = u。它等于前面已传送过的数据的最后一个字节的序号加1。这时A进入 FIN-WAIT-1(终止等待1) 状态,等待B的确认。TCP规定, FIN 报文段即使不携带数据,它也消耗掉一个序号。
B收到连接释放报文段后即发出确认,确认号 ack = u + 1,这个报文段的序号是 v,等于B前面已传送过的数据的最后一个字节的序号加1。然后B就进入 CLOSE-WAIT(关闭等待)状态。TCP服务器进程这时应通知高层应用进程,因而从A到B这个方向的连接就释放了,这时的TCP连接处于半关闭状态(half-close),即A已经没有数据要发送了,但B若发送数据,A仍要接收。也就是说,从B到A这个方向的连接并未关闭,这个状态可能会持续一段时间。
A收到来自B的确认后,就进入 FIN-WAIT-2(终止等待2)状态,等待B发出的连接释放报文段。
若B已经没有要向A发送的数据,其应用进程就通知TCP释放连接。这时B发出的连接释放报文段必须使 FIN = 1。现假定B的序号为 w。B还必须重复上次已发送过的确认号 ack = u + 1。这时B就进入 LAST-ACK(最后确认)状态,等待A的确认。
A在收到B的连接释放报文段后,必须对此发出确认。在确认报文段中把ACK置1,确认号 ack = w + 1,而自己的序号是 seq = u + 1(TCP规定,前面发送过的 FIN 报文段要消耗一个序号)。然后进入到 TIME-WAIT(时间等待)状态。现在TCP连接还没有释放掉。必须经过时间等待计时器设置的时间2MSL后,A才进入到 CLOSED 状态。时间MSL叫做最长报文段寿命,RFC 793 建议设为2分钟。但这完全是从工程上来考虑的。对于现在的网络,MSL = 2分钟可能太长了。因此TCP允许不同的实现可根据具体情况使用更小的MSL值。从A进入到 TIME-WAIT 状态后,要经过4分钟才能进入到 CLOSED 状态,才能开始建立下一个新的连接。当A撤销相应的传输控制块TCB后,就结束了这次的TCP连接。
为什么A在 TIME-WAIT 状态必须等待2MSL的时间呢?这有两个理由。
第一,为了保证A发送的最后一个ACK报文段能够到达B。这个ACK报文段有可能丢失,因而使处在 LAST-ACK 状态的B收不到对已发送的 FIN + ACK报文段的确认。B会超时重传这个 FIN + ACK 报文段,而A就能在 2MSL 时间内收到这个重传的 FIN + ACK 报文段。接着A重传一次确认,重新启动 2MSL 计时器。最后,A和B都正常进入到 CLOSED 状态。如果A在 TIME-WAIT 状态不等待一段时间,而是在发送完ACK报文段后立即释放连接,那么就无法收到B重传的 FIN + ACK 报文段,因而也不会再发送一次确认报文段。这样,B就无法按照正常步骤进入 CLOSED 状态。
第二,防止前面提到的“已失效的连接请求报文段”出现在本连接中。A在发送完最后一个 ACK 报文段后,再经过时间 2MSL,就可以使本连接持续的时间内所产生的所有报文段都从网络中消失。这样就可以使下一个新的连接中不会出现这种旧的连接请求报文段。
B只要收到了A发出的确认,就进入 CLOSED 状态。同样,B在撤销相应的传输控制块TCB后,就结束了这次的TCP连接。B结束TCP连接的时间要比A早一些。
上述的TCP连接释放过程是四报文握手。
除时间等待计时器外,TCP还设有一个保活计时器。设想有这样的情况:客户已主动与服务器建立了TCP连接。但后来客户端的主机突然出现故障。显然,服务器以后就不能再收到客户发来的数据。因此,应当有措施使服务器不要再白白等待下去。这就是使用保活计时器。服务器每收到一次客户的数据,就重新设置保活计时器,时间的设置通常是2小时。若两小时没有收到客户的数据,服务器就发送一个探测报文段,以后则每隔75秒发送一次。若一连发送10个探测报文段后仍无客户的响应,服务器就认为客户端出了故障,接着就关闭这个连接。