谈谈网络协议 – 传输层( Transport)
传输层( Transport)
- 传输层有2个协议
- TCP(Transmission Control Protocol),传输控制协议
- UDP(User Datagram Protocol),用户数据报协议
UDP - 用户数据报协议
UDP - 首部数据格式
-
UDP是无连接的,减少了建立和释放连接的开销
-
UDP尽最大能力交付,不保证可靠交付
- 因此不需要维护一些复杂的参数,首部只有8个字节(TCP的首部至少20个字节)
-
UDP长度(Length)
-
占16位,首部的长度 + 数据的长度
UDP首部 - 检验和( Checksum)
- 检验和的计算内容:伪首部 + 首部 + 数据
- 伪首部:仅在计算检验和时起作用,并不会传递给网络层
端口( Port)
- UDP首部中端口是占用2字节
- 可以推测出端口号的取值范围是:0~65535
- 客户端的源端口是临时开启的随机端口
- 防火墙可以设置开启\关闭某些端口来提高安全性
- 常用命令行 netstat –an:查看被占用的端口
- netstat –anb:查看被占用的端口、占用端口的应用程序
- telnet 主机 端口:查看是否可以访问主机的某个端口
- 安装telnet:控制面板 – 程序 – 启用或关闭Windows功能 – 勾选“Telnet Client” – 确定
UDP抓包
TCP - 传输控制协议
TCP - 首部数据格式
TCP首部 - 数据偏移
- 占4位,取值范围是0x0101~0x1111
- 乘以4:首部长度(Header Length)
- 首部长度是20~60字节
TCP首部 - 保留
- 占6位,目前全为0
首部小细节
-
有些资料中,TCP首部的保留(Reserved)字段占3位,标志(Flags)字段占9位(前3位也都是0,没什么用)
- Wireshark中也是如此
-
UDP的首部中有个16位的字段记录了整个UDP报文段的长度(首部+数据)
- 但是,TCP的首部中仅仅有个4位的字段记录了TCP报文段的首部长度,并没有字段记录TCP报文段的数据长度
-
分析
- UDP首部中占16位的长度字段是冗余的,纯粹是为了保证首部是32bit对齐
- TCP\UDP的数据长度,完全可以由IP数据包的首部推测出来
- 传输层的数据长度 = 网络层的总长度 – 网络层的首部长度 – 传输层的首部长度
TCP首部 - 检验和( Checksum)
- 跟UDP一样,TCP检验和的计算内容:伪首部 + 首部 + 数据
- 伪首部:占用12字节,仅在计算检验和时起作用,并不会传递给网络层
TCP首部 - 标志位( Flags)
-
URG(Urgent)
- 当URG=1时,紧急指针字段才有效。表明当前报文段中有紧急数据,应优先尽快传送,发送应用进程就告诉发送方的TCP有紧急数据要传送。于是发送方TCP就把紧急数据插入到本报文段数据的最前面,而紧急数据后面的数据仍是普通数据
-
ACK(Acknowledgment)
- 当ACK=1时,确认号字段才有效
-
PSH(Push)
- 推送,当两个应用进程进行交互式的通信时,有时候一端的应用进程希望在键入一个命令后立即就能收到对方的响应。在这种情况下,TCP就可应使用推送(push)操作。这时,发送方TCP把PSH置1,并立即创建一个报文段发送出去。接收方TCP收到PSH=1的报文段,就尽快地交付接收应用进程,而不再等到整个缓存都填满了再向上交付
-
RST(Reset)
- 当RST=1时,表明连接中出现严重差错,必须释放连接,然后再重新建立连接
-
SYN(Synchronization)
- 当SYN=1、ACK=0时,表明这是一个建立连接的请求 若对方同意建立连接,则回复SYN=1、ACK=1
-
FIN(Finish)
- 当FIN=1时,表明数据已经发送完毕,要求释放连接
TCP首部 - 序号、确认号、窗口
- 序号(Sequence Number)
- 占4字节
- 首先,在传输过程的每一个字节都会有一个编号 在建立连接后,序号代表:这一次传给对方的TCP数据部分的第一个字节的编号
- 确认号(Acknowledgment Number)
- 占4字节
- 在建立连接后,确认号代表:期望对方下一次传过来的TCP数据部分的第一个字节的编号
- 窗口(Window)
- 占2字节
- 这个字段有流量控制功能,用以告知对方下一次允许发送的数据大小(字节为单位)
TCP - 四大要点
- 可靠传输
- 流量控制
- 拥塞控制
- 连接管理
- 3次握手
- 4次分手
TCP - 可靠传输
停止等待 协议
- ARQ(Automatic Repeat–reQuest),自动重传请求
图例分析
-
a) 正常无差错情况
- 发送一条,确认一条
-
b) 超时重传
- 当A发送给B时网络异常导致没有发送过去
- A会启动一个定时器,在这个定时器执行(超时)之前如果一直没有收到B的回复,就会重新发送M1
-
c) 确认丢失
- A发送M1给B,B收到了,B发送M1的确认包给A没发送成功,此时A那边超时重传M1,B再次收到M1的数据包,会将上一次的M1丢弃,重传确认M1给A
-
d) 确认迟到
- A发M1给到B,B收到,发M1的确认包给A,网络延迟一直没到,A超时重传M1给B,B收到后丢弃上一次重复的M1,再次重新发送确认M1的包给A,A收到,在此之后B发送给A第一次的M1的确认包到达A,A收到后发现是已经确认过的,直接丢弃,什么也不做
一些疑问
-
若有个包重传了N次还是失败,会一直持续重传到成功为止么?
-
这个取决于系统的设置,比如有些系统,重传5次还未成功就会发送reset报文(RST)强制断开TCP连接
-
连续ARQ协议 + 滑动窗口协议
- 连续ARQ
- 一次分组批量发多个包给对方,发送完后,停止发送,等待确认,对方收到后只需要发一个(最后那个包)确认包给接收方,如果有包丢失会执行后面的 选择性确认 流程
- 滑动窗口
- 当批量的包发完后,并且回复确认,会接着发下一批数据,整个过程类似窗口一样往下滑,所以叫滑动窗口
问题
-
如果接收窗口最多能接收4个包 ,但发送方只发了2个包
-
接收方如何确定后面还有没有2个包?
- 等待一定时间后没有第3个包,就会返回确认收到2个包给发送方
-
SACK - 选择性确认
-
在TCP通信过程中,如果发送序列中间某个数据包丢失(比如1、2、3、4、5中的3丢失了)
-
TCP会通过重传最后确认的分组后续的分组(最后确认的是2,会重传3、4、5)
-
这样原先已经正确传输的分组也可能重复发送(比如4、5),降低了TCP性能
-
为改善上述情况,发展出了SACK(Selective acknowledgment,选择性确认)技术
- 告诉发送方哪些数据丢失,哪些数据已经提前收到
- 使TCP只重新发送丢失的包(比如3),不用发送后续所有的分组(比如4、5)
-
SACK信息
-
SACK信息会放在TCP首部的选项部分
- Kind:占1字节。值为5代表这是SACK选项
- Length:占1字节。表明SACK选项一共占用多少字节
- Left Edge:占4字节,左边界
- Right Edge:占4字节,右边界
-
一对边界信息需要占用8字节,由于TCP首部的选项部分最多40字节,所以
-
SACK选项最多携带4组边界信息
-
SACK选项的最大占用字节数 = 4 * 8 + 2 = 34
- SACK就是靠 两个边界值 来知道,哪些数据收到了,自然就知道哪些数据没收到
思考一个问题
- 为什么选择在传输层就将数据“大卸八块”分成多个段,而不是等到网络层再分片传递给数据链路层?
-
因为可以提高重传的性能
-
需要明确的是:可靠传输是在传输层进行控制的
- 如果在传输层不分段,一旦出现数据丢失,整个传输层的数据都得重传
- 如果在传输层分了段,一旦出现数据丢失,只需要重传丢失的那些段即可
-
网络层是没有可靠性,重传等机制的,数据要是丢了就丢了,还是需要在传输层校验
-
TCP - 流量控制
- 如果接收方的缓存区满了,发送方还在疯狂着发送数据
- 接收方只能把收到的数据包丢掉,大量的丢包会极大着浪费网络资源
- 所以要进行流量控制
- 什么是流量控制?
- 让发送方的发送速率不要太快,让接收方来得及接收处理
- 原理
- 通过确认报文中窗口字段来控制发送方的发送速率
- 发送方的发送窗口大小不能超过接收方给出窗口大小
- 当发送方收到接收窗口的大小为0时,发送方就会停止发送数据
- 流量控制是 点对点 通信的控制
特殊情况
- 有一种特殊情况
- 一开始,接收方给发送方发送了0窗口的报文段
- 后面,接收方又有了一些存储空间,给发送方发送的非0窗口的报文段丢失了
- 发送方的发送窗口一直为零,双方陷入僵局
- 解决方案
- 当发送方收到0窗口通知时,这时发送方停止发送报文
- 并且同时开启一个定时器,隔一段时间就发个测试报文去询问接收方最新的窗口大小
- 如果接收的窗口大小还是为0,则发送方再次刷新启动定时器
TCP - 拥塞控制
- 拥塞控制
- 防止过多的数据注入到网络中
- 避免网络中的路由器或链路过载
- 拥塞控制是一个全局性的过程
- 涉及到所有的主机、路由器
- 以及与降低网络传输性能有关的所有因素
- 是大家共同努力的结果
- 相比而言,流量控制是 点对点 通信的控制,而拥塞控制则是需要 整个网络 共用控制的
上图解析
- 最终两台路由器中间的带宽是 1000M,如果从右往右发送数据到达 1000M或者更高,真的能满载传输吗?
- 并不会的,当带宽快满的时候就会进入 轻度拥塞,拥塞,甚至 死锁,就和生活中的交通一样
控制方法
- 慢开始(slow start,慢启动)
- 拥塞避免(congestion avoidance)
- 快速重传(fast retransmit)
- 快速恢复(fast recovery)
- 几个缩写
- MSS(Maximum Segment Size):每个段最大的数据部分大小 ,在建立连接时确定
- cwnd(congestion window):拥塞窗口
- rwnd(receive window):接收窗口
- swnd(send window):发送窗口
- swnd = min(cwnd, rwnd) 发送窗口 = 取拥塞与接收窗口最小值
慢开始
- cwnd的初始值比较小,然后随着数据包被接收方确认(收到一个ACK)
- cwnd就成倍增长(指数级)
拥塞避免
- ssthresh(slow start threshold):慢开始阈(yu)值,cwnd达到阈值后,以线性方式增加 (加法增大)
- 拥塞避免(加法增大):拥塞窗口缓慢增大,以防止网络过早出现拥塞
- 乘法减小:只要网络出现拥塞(丢包),把ssthresh减为拥塞峰值的一半,同时执行慢开始算法(cwnd又恢复到初始值)
- 当网络出现频繁拥塞时,ssthresh值就下降的很快
快重传
- 接收方
- 每收到一个失序的分组后就立即发出重复确认
- 使发送方及时知道有分组没有到达
- 而不要等待自己发送数据时才进行确认
- 发送方
- 只要连续收到三个重复确认(总共4个相同的确认),就应当立即重传对方尚未收到的报文段
- 而不必继续等待重传计时器到期后再重传
如上图,发送方,连续发送了M1到M7的数据给到接收方,当接收方发现M3没收到的时候,就会立即发送3次M2的重复确认,发送方收到3次重复确认后会立即重传M3
快恢复
-
当发送方连续收到三个重复确认,说明网络出现拥塞
-
就执行“乘法减小”算法,把ssthresh减为拥塞峰值的一半
-
与慢开始不同之处是现在不执行慢开始算法,即cwnd现在不恢复到初始值
- 而是把cwnd值设置为新的ssthresh值(减小后的值)
- 然后开始执行拥塞避免算法(“加法增大”),使拥塞窗口缓慢地线性增大
快重传 + 快恢复
发送窗口的最大值
- 发送窗口的最大值:swnd = min(cwnd, rwnd)
- 当rwnd < cwnd时,是接收方的接收能力限制发送窗口的最大值
- 当cwnd < rwnd时,则是网络的拥塞限制发送窗口的最大值
TCP - 序号、确认号
图解
-
顺序分解
- 前3步为TCP的3次握手
- 第4步才是真正发起HTTP网络请求
- 第5 - 8步 是服务器返回数据给客户端
- 第9步是客户端收到所有的数据,向服务端发送确认报文
-
参数详解
-
SYN:同步码
- 为1时代表建立连接,同步请求,只有第1步和第2步双方第一次建立请求的时候才会为1,其它为 0
-
ACK:确认码
- 当对方发消息给你,你需要回复确认报文,表示你已经收到
-
seq:序号
- 在建立TCP连接时初始化的
- 第1步时会将发起方的序号发给对方
- 第2步对方收到后也会发起同步码建立连接,也会发它的序号过来
- 序号在每次请求的时候:这一次传给对方的TCP数据部分的第一个字节的编号 + 1
-
ack:确认号
-
当对方发送数据给过来,你要给对方确认回复
-
确认号:对方的基础序号 + 数据长度 + 1
-
表示的是:期望对方下一次传过来的TCP数据部分的第一个字节的编号
-
-
TCP - 建立连接 - 3次握手
图解
-
第1步:客户端 => 服务器 发起 连接请求,SYN=1,ACK=0,seq=x
- 客户端默认是 CLOSED(关闭)状态
- 发送后,进入 SYN-SENT(同步已发送)状态
-
第2步:服务器收到客户端的 连接请求 后,向 客户端 发起 连接请求确认,SYN=1,ACK=1,seq=y,ack=x+1
- 服务器默认是 LISTEN(监听)状态
- 接收到客户端的SYN报文后,进入 SYN-RCVD(同步已接收)状态
-
第3步:客户端收到服务器的 连接请求确认 报文后,向 服务器 发起最终 确认 报文,此时连接建立成功
-
客户端收到服务器的 连接请求确认 报文后,并再次发送ACK 确认 报文给服务器,并将客户端状态设置为 ESTABLISHED(连接已建立)状态
-
服务器在收到客户端的第3次ACK确认后,也进入 ESTABLISHED(连接已建立)状态
-
状态解读
-
CLOSED:client处于关闭状态
-
LISTEN:server处于监听状态,等待client连接
-
SYN-RCVD:表示server接受到了SYN报文,当收到client的ACK报文后,它会进入到 ESTABLISHED 状态
-
SYN-SENT:表示client已发送SYN报文,等待server的第2次握手
-
ESTABLISHED:表示连接已经建立
前2次握手的特点
-
SYN都设置为1
-
数据部分的长度都为0
-
TCP头部的长度一般是32字节
- 固定头部:20字节
- 选项部分:12字节
-
双方会交换确认一些信息
-
比如MSS、是否支持SACK、Window scale(窗口缩放系数)等
-
这些数据都放在了TCP头部的选项部分中(12字节)
-
一些疑问
1. 为什么建立连接的时候,要进行3次握手?2次不行么?
-
主要目的:防止server端一直等待,浪费资源
-
如果建立连接只需要2次握手,可能会出现的情况
- 假设client发出的第一个连接请求报文段,因为网络延迟,在连接释放以后的某个时间才到达server
- 本来这是一个早已失效的连接请求,但server收到此失效的请求后,误认为是client再次发出的一个新的连接请求
- 于是server就向client发出确认报文段,同意建立连接
- 如果不采用“3次握手”,那么只要server发出确认,新的连接就建立了
- 由于现在client并没有真正想连接服务器的意愿,因此不会理睬server的确认,也不会向server发送数据
- 但server却以为新的连接已经建立,并一直等待client发来数据,这样,server的很多资源就白白浪费掉了
-
采用“三次握手”的办法可以防止上述现象发生
- 例如上述情况,client没有向server的确认发出确认,server由于收不到确认,就知道client并没有要求建立连接
2. 第3次握手失败了,会怎么处理?
-
此时server的状态为SYN-RCVD,若等不到client的ACK,server会重新发送SYN+ACK包
-
如果server多次重发SYN+ACK都等不到client的ACK,就会发送RST包,强制关闭连接
TCP - 释放连接 - 4次挥手
图解
-
第1步:客户端 => 服务器 发起 FIN(完成本次连接,申请断开连接)连接释放 报文请求,ACK=1,seq=u,ack=v
- 默认双方都是 ESTABLISHED(连接建立)状态
- 发起 FIN 连接释放 报文后,进入 FIN-WAIT-1(终止等待1)状态
-
第2步:服务器收到客户端的 FIN 连接释放 报文后,向 客户端发起 ACK 确认 报文,ACK=1,seq=v,ack=u+1
- 服务器收到 FIN 连接释放 报文后,并回复 ACK 确认 后,进入 CLOSE-WAIT(关闭等待)状态
- 客户端收到 ACK 确认 报文后,进入 FIN-WAIT-2(终止等待2)状态
- 回复 ACK 确认 报文后,服务器会判断是否还有数据要发给客户端
- 有,就继续发数据给客户端,此时客户端还是能正常接收的
- 没有,就发起第3步
-
第3步:再次向客户端发起 FIN 连接释放 请求,FIN=1,ACK=1,seq=w,ack=u+1
- 向客户端发起 FIN 连接释放 报文后,进入 LAST-ACK(最后确认)状态
- 客户端收到 FIN 连接释放 报文后,进入 TIME-WAIT(时间等待)状态
-
第4步:客户端收到服务器的 FIN 连接释放 报文后,再发送ACK 确认 报文给服务器
- 服务器在收到最后一次 ACK 确认 报文后,进入 CLOSED(关闭)状态
- 客户端发送完最后一次 ACK 确认 报文后,开启一个定时器,在 2 倍的 MSL 时长后 才进入 CLOSED(关闭)状态
注意点: 第2,3步在有些情况下是会进行合并的,就是当服务器收到 **FIN 连接释放** 报文后,能立刻确定也没有数据发送给客户端了,时些就会合并这2步,FIN=1,ACK=1
状态解读
-
FIN-WAIT-1:表示想主动关闭连接
- 向对方发送了FIN报文,此时进入到FIN-WAIT-1状态
-
CLOSE-WAIT:表示在等待关闭
- 当对方发送FIN给自己,自己会回应一个ACK报文给对方,此时则进入到CLOSE-WAIT状态
- 在此状态下,需要考虑自己是否还有数据要发送给对方,如果没有,发送FIN报文给对方
-
FIN-WAIT-2:只要对方发送ACK确认后,主动方就会处于FIN-WAIT-2状态,然后等待对方发送FIN报文
-
CLOSING:一种比较罕见的例外状态
- 表示你发送FIN报文后,并没有收到对方的ACK报文,反而却也收到了对方的FIN报文
- 如果双方几乎在同时准备关闭连接的话,那么就出现了双方同时发送FIN报文的情况,也即会出现CLOSING状态
- 表示双方都正在关闭连接
-
LAST-ACK:被动关闭一方在发送FIN报文后,最后等待对方的ACK报文
- 当收到ACK报文后,即可进入CLOSED状态了
-
TIME-WAIT:表示收到了对方的FIN报文,并发送出了ACK报文,就等2MSL后即可进入CLOSED状态了
- 如果FIN-WAIT-1状态下,收到了对方同时带FIN标志和ACK标志的报文时
- 可以直接进入到TIME-WAIT状态,而无须经过FIN-WAIT-2状态
- 如果FIN-WAIT-1状态下,收到了对方同时带FIN标志和ACK标志的报文时
-
CLOSED:关闭状态
-
由于有些状态的时间比较短暂,所以很难用netstat命令看到,比如SYN-RCVD、FIN-WAIT-1等
释放连接 - 一些细节
-
TCP/IP协议栈在设计上,允许任何一方先发起断开请求。这里演示的是client主动要求断开
-
client发送ACK后,需要有个TIME-WAIT阶段,等待一段时间后,再真正关闭连接
- 一般是等待2倍的MSL(Maximum Segment Lifetime,最大分段生存期)
- MSL是TCP报文在Internet上的最长生存时间
- 每个具体的TCP实现都必须选择一个确定的MSL值,RFC 1122建议是2分钟
- 可以防止本次连接中产生的数据包误传到下一次连接中(因为本次连接中的数据包都会在2MSL时间内消失了)
- 一般是等待2倍的MSL(Maximum Segment Lifetime,最大分段生存期)
-
如果client发送ACK后马上释放了,然后又因为网络原因,server没有收到client的ACK,server就会重发FIN
-
这时可能出现的情况是
-
client没有任何响应,服务器那边会干等,甚至多次重发FIN,浪费资源
-
client有个新的应用程序刚好分配了同一个端口号,新的应用程序收到FIN后马上开始执行断开连接的操作,本来 它可能是想跟server建立连接的
-
-
释放连接 - 一些疑问
1. 为什么释放连接的时候,要进行4次挥手?
-
TCP是全双工模式,双方可以同时向发起请求和接收数据
-
如果只有前3次,那服务器是不知道客户端有没有真正收到 FIN 的报文,客户端也一样不知道服务器有没有收到它的请求连接释放请求
-
第1次挥手:当主机1发出FIN报文段时
- 表示主机1告诉主机2,主机1已经没有数据要发送了,但是,此时主机1还是可以接受来自主机2的数据
-
第2次挥手:当主机2返回ACK报文段时
- 表示主机2已经知道主机1没有数据发送了,但是主机2还是可以发送数据到主机1的
-
第3次挥手:当主机2也发送了FIN报文段时
- 表示主机2告诉主机1,主机2已经没有数据要发送了
-
第4次挥手:当主机1返回ACK报文段时
- 表示主机1已经知道主机2没有数据发送了。随后正式断开整个TCP连接
2. 为什么有时候只有 "3次" 挥手?
- 这其实是将第2、3次挥手合并了
- 当server接收到client的FIN时,如果server后面也没有数据要发送给client了
- 这时,server就可以将第2、3次挥手合并,同时告诉client两件事
- 已经知道client没有数据要发
- server已经没有数据要发了
- 这时,server就可以将第2、3次挥手合并,同时告诉client两件事
3次挥手 - 抓包图