TCP/IP之TCP协议首部、三次握手、四次挥手、FSM

TCP包头

<--------------------------------32 位------------------------------>

0                8                16               24               32
|----------------|----------------|----------------|----------------|  -----
|            Source port          |         Destination port        |    |
|-------------------------------------------------------------------|    |
|                               序 号                                |
|-------------------------------------------------------------------|   20字节
|                              确 认 号                              |   固 定
|-------------------------------------------------------------------|   首 部
|        |           | U A P R S F|                                 |    
|数据偏移 |  保 留    | R C S S Y I|               窗口               |
|        |           | G K H T N N|                                 |    |
|-------------------------------------------------------------------|    |
|              校 验 和            |             紧急指针             |    
|-------------------------------------------------------------------|   -----
|              选 项 (长 度 可 变)                 |      填充      |
---------------------------------------------------------------------

TCP包头

  • 源端口、目标端口 :计算机上的进程要和其他进程通信是要通过计算机端口的,而一个计算机端口某个时刻只能被一个进程占用,所以通过指定源端口和目标端口,就可以知道是哪两个进程需要通信。源端口、目标端口是用16位表示的,可推算计算机的端口个数为2^16个。

  • 序列号 :表示本报文段所发送数据的第一个字节的编号。在TCP连接中所传送的字节流的每一个字节都会按顺序编号。由于序列号由32位表示,所以每2^32个字节,就会出现序列号回绕,再次从 0 开始。

  • 确认号 :表示接收方期望收到发送方下一个报文段的第一个字节数据的编号。也就是告诉发送方:我希望你(指发送方)下次发送的数据的第一个字节数据的编号为此确认号。

  • 数据偏移 :表示TCP报文段的首部长度,共4位,由于TCP首部包含一个长度可变的选项部分,需要指定这个TCP报文段到底有多长。它指出 TCP 报文段的数
    据起始处距离 TCP 报文段的起始处有多远。该字段的单位是32位(即4个字节为计算单位),4位二进制最大表示15,所以数据偏移也就是TCP首部最大60字节。

  • URG :表示本报文段中发送的数据是否包含紧急数据。后面的紧急指针字段(urgent pointer)只有当URG=1时才有效。

  • ACK :表示是否前面确认号字段是否有效。只有当ACK=1时,前面的确认号字段才有效。TCP规定,连接建立后,ACK必须为1,带ACK标志的TCP报文段称为确认报文段。

  • PSH :提示接收端应用程序应该立即从TCP接收缓冲区中读走数据,为接收后续数据腾出空间。如果为1,则表示对方应当立即把数据提交给上层应用,而不是缓存起来,如果应用程序不将接收到的数据读走,就会一直停留在TCP接收缓冲区中。

  • RST :如果收到一个RST=1的报文,说明与主机的连接出现了严重错误(如主机崩溃),必须释放连接,然后再重新建立连接。或者说明上次发送给主机的数据有问题,主机拒绝响应,带RST标志的TCP报文段称为复位报文段。

  • SYN :在建立连接时使用,用来同步序号。当SYN=1,ACK=0时,表示这是一个请求建立连接的报文段;当SYN=1,ACK=1时,表示对方同意建立连接。SYN=1,说明这是一个请求建立连接或同意建立连接的报文。只有在前两次握手中SYN才置为1,带SYN标志的TCP报文段称为同步报文段。

  • FIN :表示通知对方本端要关闭连接了,标记数据是否发送完毕。如果FIN=1,即告诉对方:“我的数据已经发送完毕,你可以释放连接了”,带FIN标志的TCP报文段称为结束报文段。

  • 窗口大小 :表示现在允许对方发送的数据量,也就是告诉对方,从本报文段的确认号开始允许对方发送的数据量,达到此值,需要ACK确认后才能再继续传送后面数据,由Window size value * Window size scaling factor(此值在三次握手阶段TCP选项Window scale协商得到)得出此值。

  • 校验和 :提供额外的可靠性。

  • 紧急指针 :标记紧急数据在数据字段中的位置。

  • 选项部分 :其最大长度可根据TCP首部长度进行推算。TCP首部长度用4位表示,选项部分最长为:(2^4-1)*4-20=40字节。

    常见选项:

    • 最大报文段长度:Maxium Segment Size,MSS,通常1460字节

    • 窗口扩大:Window Scale

    • 时间戳: Timestamps

    • 1 最大报文段长度MSS(Maximum Segment Size)
      指明自己期望对方发送TCP报文段时那个数据字段的长度。比如:1460字节。数据字段的长度加上TCP首部的长度才等于整个TCP报文段的长度。 MSS不宜设的太大也不宜设的太小。若选择太小,极端情况下,TCP报文段只含有1字节数据,在IP层传输的数据报的开销至少有40字节(包括TCP报文段的首部和IP数据报的首部)。这样,网络的利用率就不会超过1/41。若TCP报文段非常长,那么在IP层传输时就有可能要分解成多个短数据报片。在终点要把收到的各个短数据报片装配成原来的TCP报文段。当传输出错时还要进行重传,这些也都会使开销增大。因此MSS应尽可能大,只要在IP层传输时不需要再分片就行。在连接建立过程中,双方都把自己能够支持的MSS写入这一字段。MSS只出现在SYN报文中。即:MSS出现在SYN=1的报文段中。

      • MTU和MSS值的关系:MTU=MSS+IP Header+TCP Header
      • 通信双方最终的MSS值=较小MTU-IP Header-TCP Header
    • 2 窗口扩大
      为了扩大窗口,由于TCP首部的窗口大小字段长度是16位,所以其表示的最大数是65535。但是随着时延和带宽比较大的通信产生(如卫星通信),需要更大的窗口来满足性能和吞吐率,所以产生了这个窗口扩大选项。

    • 3 时间戳
      可以用来计算RTT(往返时间),发送方发送TCP报文时,把当前的时间值放入时间戳字段,接收方收到后发送确认报文时,把这个时间戳字段的值复制到确认报文中,当发送方收到确认报文后即可计算出RTT。也可以用来防止回绕序号PAWS,也可以说可以用来区分相同序列号的不同报文。因为序列号用32为表示,每2^32个序列号就会产生回绕,那么使用时间戳字段就很容易区分相同序列号的不同报文。

映射第四层到应用程序

TCP协议PORT

  • 传输层通过port号,确定应用层协议
  • Port number:
    • tcp:传输控制协议,面向连接的协议;通信前需要建立虚拟链路;结束后拆除链路。
      0-65535
    • udp:User Datagram Protocol,无连接的协议。
      0-65535
  • IANA:互联网数字分配机构(负责域名,数字资源,协议分配)
    • 0-1023:系统端口或特权端口(仅管理员可用) ,众所周知,永久的分配给固定的系统应用使用,22/tcp(ssh), 80/tcp(http), 443/tcp(https)

    • 1024-49151:用户端口或注册端口,但要求并不严格,分配给程序注册为某应用使用,1433/tcp(SqlServer), 1521/tcp(oracle),3306/tcp(mysql),11211/tcp/udp(memcached)

    • 49152-65535:动态端口或私有端口,客户端程序随机使用的端口。
      其范围的定义:

      /proc/sys/net/ipv4/ip_local_port_range
      

TCP三次握手

握手 客户端状态 客户端TCP 方向 服务器TCP 服务器状态 描述
第一次 初始:CLOSED
发送:SYN-SENT
SYN=1, seq=x ----> 初始:LISTEN
接收:SYN-RECEIVED
同步(SYN)
第二次 接收:SYN-SENT <---- SYN=1, ACK=1, seq=y, ack=x+1 发送:SYN-RECEIVED 同步、确认(ACK)
第三次 发送:ESTABLISHED ACK=1, seq=x+1, ack=y+1 ----> 接收:ESTABLISHED 确认(ACK)
数据传输 <--->

TCP四次挥手

挥手 客户端状态 客户端TCP 方向 服务器TCP 服务器状态 描述
第一次 初始:ESTABLISHED
发送:FIN-WAIT-1
FIN=1, seq=u ----> 初始:ESTABLISHED
接收:CLOSE-WAIT
分手(FIN)
第二次 接收:FIN-WAIT-2 <---- ACK=1, seq=v, ack=u+1 发送:CLOSE-WAIT 好的(ACK)
第三次 接收:FIN-WAIT-2 <---- FIN=1, ACK=1, seq=w, ack=u+1 发送:LAST-ACK 分手(FIN+ACK)
第四次 发送:TIME-WAIT
2MSL后:CLOSED
ACK=1, seq=u+1, ack=w+1 ----> 接收:CLOSED 好的(ACK)

为什么是三次握手、四次挥手

这是因为服务端在LISTEN状态下,收到建立连接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端。而关闭连接时,当收到对方的FIN报文时,仅仅表示对方不再发送数据了但是还能接收数据,己方也未必全部数据都发送给对方了,所以己方可以立即close,也可以发送一些数据给对方后,再发送FIN报文给对方来表示同意现在关闭连接,因此,己方ACK和FIN一般都会分开发送。

这是因为服务端的LISTEN状态下的SOCKET当收到SYN报文的建连请求后,它可以把ACK和SYN(ACK起应答作用,而SYN起同步作用)放在一个报文里来发送。但关闭连接时,当收到对方的FIN报文通知时,它仅仅表示对方没有数据发送给你了;但未必你所有的数据都全部发送给对方了,所以你可以未必会马上会关闭SOCKET,也即你可能还需要发送一些数据给对方之后,再发送FIN报文给对方来表示你同意现在可以关闭连接了,所以它这里的ACK报文和FIN报文多数情况下都是分开发送的。

有限状态机FSM :Finite State Machine

FSM 说明
CLOSED 没有任何连接状态
LISTEN 侦听状态,等待来自远方TCP端口的连接请求
SYN-SENT 在发送连接请求后,等待对方确认
SYN-RECEIVED 在收到和发送一个连接请求后,等待对方确认
ESTABLISHED 代表传输连接建立,双方进入数据传送状态
FIN-WAIT-1 主动关闭,主机已发送关闭连接请求,等待对方确认
FIN-WAIT-2 主动关闭,主机已收到对方关闭传输连接确认,等待对方发送关闭传输连接请求
TIME-WAIT 完成双向传输连接关闭,等待所有分组消失
CLOSE-WAIT 被动关闭,收到对方发来的关闭连接请求,并已确认
LAST-ACK 被动关闭,等待最后一个关闭传输连接确认,并等待所有分组消失
CLOSING 双方同时尝试关闭传输连接,等待对方确认

客户端先发送一个FIN给服务端,自己进入了FIN_WAIT_1状态,这时等待接收服务端的报文,该报文会有三种可能:

  • 只有服务端的ACK
  • 只有服务端的FIN
  • 基于服务端的ACK,又有FIN

1、只收到服务器的ACK,客户端会进入FIN_WAIT_2状态,后续当收到服务端的FIN时,回应发送一个ACK,会进入到TIME_WAIT状态,这个状态会持续2MSL(TCP报文段在网络中的最大生存时间,RFC 1122标准的建议值是2min)。客户端等待2MSL,是为了当最后一个ACK丢失时,可以再发送一次。因为服务端在等待超时后会再发送一个FIN给客户端,进而客户端知道ACK已丢失。

2、只有服务端的FIN时,回应一个ACK给服务端,进入CLOSING状态,然后接收到服务端的ACK时,进入TIME_WAIT状态。

3、同时收到服务端的ACK和FIN,直接进入TIME_WAIT状态。

客户端的典型状态转移

  • 客户端通过connect系统调用主动与服务器建立连接connect系统调用首先给服务器发送一个同步报文段,使连接转移到SYN_SENT状态。
  • 此后connect系统调用可能因为如下两个原因失败返回:

1、如果connect连接的目标端口不存在(未被任何进程监听),或者该端口仍被处于TIME_WAIT状态的连接所占用(见后文),则服务器将给客户端发送一个复位报文段,connect调用失败。

2、如果目标端口存在,但connect在超时时间内未收到服务器的确认报文段,则connect调用失败。

connect调用失败将使连接立即返回到初始的CLOSED状态。如果客户端成功收到服务器的同步报文段和确认,则connect调用成功返回,连接转移至ESTABLISHED状态。

当客户端执行主动关闭时,它将向服务器发送一个结束报文段,同时连接进入FIN_WAIT_1状态。若此时客户端收到服务器专门用于确认目的的确认报文段,则连接转移至FIN_WAIT_2状态。当客户端处于FIN_WAIT_2状态时,服务器处于CLOSE_WAIT状态,这一对状态是可能发生半关闭的状态。此时如果服务器也关闭连接(发送结束报文段),则客户端将给予确认并进入TIME_WAIT状态。

客户端从FIN_WAIT_1状态可能直接进入TIME_WAIT状态(不经过FIN_WAIT_2状态),前提是处于FIN_WAIT_1状态的服务器直接收到带确认信息的结束报文段(而不是先收到确认报文段,再收到结束报文段)。

处于FIN_WAIT_2状态的客户端需要等待服务器发送结束报文段,才能转移至TIME_WAIT状态,否则它将一直停留在这个状态。如果不是为了在半关闭状态下继续接收数据,连接长时间地停留在IN_WAIT_2状态并无益处。连接停留在FIN_WAIT_2状态的情况可能发生在:客户端执行半关闭后,未等服务器关闭连接就强行退出了。此时客户端连接由内核来接管,可称之为孤儿连接(和孤儿进程类似)。

Linux为了防止孤儿连接长时间存留在内核中,定义了两个内核参数:

  • /proc/sys/net/ipv4/tcp_max_orphans 指定内核能接管的孤儿连接数目
  • /proc/sys/net/ipv4/tcp_fin_timeout 指定孤儿连接在内核中生存的时间

有限状态机

TCP协议中的三次握手和四次挥手

客户机端的三次握手和四次挥手、服务器端的三次握手和四次挥手

graph TB C(CLOSED) S(SYN_SENT) E(ESTABLISHED) F1(FIN_WAIT_1) F2(FIN_WAIT_2) T(TIME_WAIT) SC(CLOSED) L(LISTEN) SR(SYN_RCVD) SE(ESTABLISHED) CW(CLOSE_WAIT) LA(LAST_ACK) subgraph 客户机端的三次握手和四次挥手 C --"发送SYN"--> S S --"接收SYN和ACK,发送ACK"--> E E --"发送FIN"--> F1 F1 --"接收确认,不发送任何信息"--> F2 F2 --"接收FIN,发送ACK"--> T T --"等待30秒"--> C end subgraph 服务器端的三次握手和四次挥手 SC --监听--> L L --"接收SYN,发送SYN和ACK"--> SR SR --"接收ACK,不发送任何信息"--> SE SE --"接收FIN,发送ACK"--> CW CW --"发送FIN"--> LA LA --"接收ACK,不发送任何信息"--> SC end
posted @ 2019-01-10 22:09  haona_li  阅读(478)  评论(0编辑  收藏  举报