谈TCP的可靠性,不得不说拥塞控制
在某段时间,若对网络中某以资源的需求超过了该资源所能提供的可用部分,网络性能就要变坏。这种情况就叫做拥塞。(在计算机网络中的链路容量(即带宽),交换节点中的缓存和处理机等,都是网络资源)
若出现拥塞而不进行控制,整个网络的吞吐量将随输入负荷的增大而下降。
发送方维护一个叫做拥塞窗口cwnd的状态变量,其值取决于网络的拥塞程度,并且动态变化。
- 拥塞窗口cwnd的维护原则:只要网络没有出现拥塞,拥塞窗口就增大一些;但只要网络出现拥塞,拥塞窗口就减少一些。
- 判断出现网络拥塞的依据:没有按时收到应当到达的确认报文(即发生超时重传)
发送方将拥塞窗口作为发送窗口swnd,即swnd=cwnd。
维护一个慢开始门限ssthresh状态变量:
- 当cwnd<ssthresh时,使用慢开始算法;
- 当cwnd>ssthresh时,停止使用慢开始算法而改用拥塞避免算法;
- 当cwnd=ssthresh时,即可使用慢开始算法,也可使用拥塞避免算法;
慢开始是指一开始向网络注入的报文段少,并不是指拥塞窗口cwnd增长速度慢;
拥塞避免并非指完全能够避免拥塞,而是指在拥塞避免阶段将拥塞窗口控制为按线性规律增长,使网络比较不容易出现拥塞;
有时,个别报文段会在网络中丢失,但实际上网络并未发生拥塞。
- 这将导致发送方超时重传,并误认为网络发生拥塞;
- 发送方把拥塞窗口cwnd又设置为1,并错误地启动慢开始算法,因而降低了传输效率。
采用快重传算法可以让发送方今早知道发生了个别报文段的丢失。
所谓快重传,就是使发送方尽快进行重传,而不是等超时重传计时器超时再重传。
- 要求接收方不要等待自己发送数据时才进行稍待确认,而是要立即发送确认;
- 即使收到了失序的报文段也要立即发出对已收到的报文段的重复确认。
- 发送方一旦收到3个连续的重复确认,就将相应的报文段立即重传,而不是等该报文段的超时重传计时器超时再重传。
发送方一旦收到3个重复确认,就是知道现在只是丢失了个别报文段,于是不启动慢开始算法,而执行快回复算法;
- 发送方将慢开始门限ssthresh值和拥塞窗口cwnd值调整为当前窗口的一半;开始执行拥塞避免算法。
-
也有的快恢复实现是把快恢复开始时的拥塞窗口cwnd值再增大一些;即等于新的ssthresh+3。原因:既然发送方收到3个重复确认,就表明有3个数据报文段离开网络;
这3个报文段不再消耗网络资源而是停留在接收方的接收缓存中;
可见现在网络中不是堆积了报文段而是减少了3个报文段。因此可以适当把拥塞窗口扩大些。