运输层

运输层协议概述

进程之间的通信

网络层是为主机之间提供逻辑通信,而运输层为应用进程之间提供端到端的逻辑通信。

运输层的两个主要协议

(1)用户数据报协议UDP

在传送数据之前不需要先建立连接。远程主机的运输层收到UDP报文后,不需要给出任何确认。

(2)传输控制协议TCP

面向连接的服务。传送数据之前必须先建立连接,数据传送结束后要释放连接。

运输层的端口

TCP/IP的运输层用一个16位端口号来标志一个端口。端口号只有本地意义。它是为了标志本计算机应用层中的各个进程在和运输层交互时的层间接口。

运输层的端口号分为以下两类:

(1)服务器端口使用的端口号

分为系统端口号0~1023和登记端口号1024~49151

应用程序 FTP TELNET SMTP DNS TFTP HTTP SNMP SNMP(trap)
端口号 21 23 25 53 69 80 161 162

(2)客户端使用的端口号

49152~65535,这类端口号仅在客户端进程运行时才动态选择。当服务器收到客户端进程的报文时,就知道客户端进程的端口号。因而可以把数据发送给客户进程。

用户数据报协议UDP

 UDP 概述

特点:

(1)UDP是无连接的,发送数据之前不需要建立连接,因此减少开销和发送数据之前的时延。

(2)UDP使用尽最大努力交付

(3)UDP是面向报文的。发送方的UDP对应用交下来的报文,添加首部后就向下交付给IP层。不对报文做任何处理,因此当报文过长时,IP层可能需要进行分片处理。

(4)UDP没有拥塞控制。网络出现的拥塞不会使源主机的发送速率减低。

(5)UDP支持一对一、一对多、多对一和多对多的交互通信。

(6)UDP的首部开销小,只有8个字节。

UDP的首部格式

(1)源端口

(2)目的端口

(3)长度:UDP用户数据报长度,最短为8字节(首部)

(4)校验和

伪首部:该部分并不用来传送,只用于校验和。计算校验和时,将伪首部临时加在UDP数据报前面。与IP只校验首部不同的是,UDP校验首部和数据部分。

如果接收方发现收到的报文的目的端口不正确,就丢弃该报文,并由网际控制报文协议ICMP发送“端口不可达”差错报文给发送方。

传输控制协议TCP概述

TCP主要特点

(1)TCP是面向连接的运输层协议。应用程序在使用TCP协议之前,必须先建立TCP连接。传送数据完毕后,必须释放TCP连接。

(2)每一条TCP连接只能有两个端点,每一条TCP连接只能点对点的。

(3)TCP提供可靠的交付的服务。通过TCP连接传送的数据,无差错、不丢失、不重复,并且按序到达。

(4)TCP提供全双工通信。

(5)面向字节流。虽然应用程序和TCP的交互是一次一个数据块,但TCP把应用程序交下来的数据看成一连串的无结构的字节流。TCP不保证发送方发送的数据块和接收方接收的数据块一致,但保证程序接收到的字节流和程序发送的字节流一致。

TCP和UDP在发送报文时采用的方式完全不同。TCP并不关心应用进程一次把多长的报文发送到TCP的缓存中,而是根据对方给出的窗口值和当前网络拥塞的程度决定一个报文段应包含多少个字节。

TCP的连接

TCP连接的端点是个很抽象的套接字,即(IP地址:端口号),同一个IP地址可以有许多不同的TCP连接,而同一个端口也可以出现多个不同的TCP连接。

可靠传输的工作原理

停止等待协议

无差错情况

出现差错

上图中,B在接收M1时检测到了错误,就丢弃M1,其他什么也不做。也可能是M1在传输过程中丢失了。这两种情况下:A只要超过了一段时间仍没有收到确认,就认为刚才发送的分组丢失了而重传刚才发过的分组。

应注意以下三点:

(1)A在发送完一个分组后,必须暂时保留已发送的分组的副本

(2)分组和确认分组必须编号,这样才能明确哪一个发出的分组收到了确认

(3)超时计时器设置的重传时间应当比数据在分组传输的平均往返时间更长

 确认丢失和确认迟到

图a说明的是B所发送的对M1的确认丢失了,A在设定时间内没有收到确认则重传M1。B收到重传的M1后,丢弃这个重复分组M1。并向A发送确认。

图b说明的是B所发送的确认迟到了,处理如图所示。

信道利用率

停止等待协议的优点是简单,但缺点是信道利用率低。

信道利用率U = Td/(Td + RTT + Ta)

Td等于分组长度除以数据率,Ta等于确认分组发送的时间,RTT等于往返时间。

 

为了提高信道利用率,发送方可以不使用停止等待协议,而是采用流水线传输。即不必每发完一个分组就停下来等待对方的确认。下面的ARQ和滑动窗口协议便是这种流水线传输。

连续ARQ协议

连续ARP协议规定,发送方每收到一个确认,就把发送窗口向前滑动一个分组的位置。

接收方采用累计确认的方式。也就是,接收方不必对收到的分组逐个发送确认。而是在收到几个分组后,对按序到达的最后一个分组发送确认。这种方式的优点是:容易实现,即使确认丢失也不必重传(意思是发送方不必重传)。但缺点是不能向发送方反映出接收方已经正确收到的所有分组信息。

TCP报文段的首部格式

TCP虽然是面向字节流的,但传送TCP的数据单元却是报文段。一个TCP报文段可以分为首部和数据两部分。

(1)源端口和目的端口:各占2个字节

(2)序号:占4个字节,序号范围0~2^32-1,当需要达到最大值后,下一个序号又回到0。TCP是面向字节流的,因此这里的序号是指字节的序号,TCP连接中传送的每一个字节都按序编号,首部中的序号值应该是本报文段的第一个字节的序号。比如,一个报文段的序号值为301,而携带的数据共有100个字节。这表明本报文的数据的第一个字节的序号是301,最后一个字节的序号是400。下一个报文的序号应该是401。

(3)确认号:占4个字节,期望收到对方下一个报文段的第一个数据字节的序号。比如,B正确收到A的报文段,序号为501,数据长200。因此B希望收到A的下一个数据序号为701,则B在发送给A的确认报文段中把确认号设为701

(4)数据偏移:占4位,指出数据起始处举例TCP报文段的起始处有多远,其实就是指出了TCP报文的首部长度。单位是4字节,4位的最大值是15,因此首部长度最大为4×15=60字节。

(5)保留:占6位

(6)紧急URG:当URG=1时,紧急指针有效。告诉系统该报文段有紧急数据,应尽快传送。

(7)确认ACK:当ACK=1时确认号字段才有效

(8)推送PSH:PSH=1时,发送方立即创建报文发送出去,接收方也会尽快交付。

(9)复位RST:当RST=1,表明TCP连接中出现严重差错,必须释放连接,然后重新建立连接。

(10)同步SYN:在建立连接时用来同步序号。当SYN=1时而ACK=0时,这是一个连接请求报文段。若对方同意连接,则应在响应的报文段使SYN=1和ACK=1。

(11)终止FIN:用来释放连接。当FIN=1时,表明报文段的发送方的数据已经发送完毕,要求释放运输连接。

(12)窗口:占2个字节,窗口值告诉对方:从本报文段首部的确认号算起,接收方目前允许对方发送的数据量。之所以有这个限制是因为接收方的数据缓存是有限的。

(13)检验和:占2个字节,检验和的计算和UDP一样,检验首部和数据两部分,而且依然要加上伪首部,伪首部的格式个UDP一致,但把第四个字段的17改为6。

(14)紧急指针:占2个字节。URG=1时才有效。指出本报文段的紧急数据的字节数。

(15)选项:最长40个字节

TCP可靠确认传输的实现

以字节为单位的滑动窗口

如图a,A收到B的确认报文段,其中窗口是20,确认号是31,则A构造自己的发送窗口如图a。

图b,现在假定A发送了序号为31~41的数据。这时,发送窗口的位置并未改变,发送窗口内靠后的11个字节(黄色部分)表示 已发送但未收到确认。

即小于P1的是已发送并收到确认的序号,而大于P3的是不允许发送的部分。

B的接收窗口大小是20,在接收窗口外面到30号位置的数据是接收并确认的,因此可以丢弃。在图b中,B收到了32和33的数据,但它们不是按序到达的,因为并没有收到31号数据。B只能对按序达收到的数据中的最高序号给出确认,因此B发送的确认报文字段的确认号依然是31号。

现在假定B收到了序号为31的数据,并把31~33的数据交付主机,然后B删除这些数据。接着把窗口向前移动3个序号,如图c,同时给a发送确认,其中的窗口值仍为20,但确认号变为34。表明B已经收到序号33为止的数据。

当A发送完窗口内的所有数据后,未收到任何确认时,窗口内就没有可发送的数据。经过一段时间后(超时计时器),若仍未收到确认,A将会重新发送。

超时重传时间的选择

第一次测量时,加权平均往返时间取往返时间RTT,以后每次测量到一个新的RTT,按以下公式计算:

a取0<=a<=1

 第一次测量时,RTT偏差的加权平均等于RTT的一半,以后的测里中,按以下公式计算:

b取0<=b<=1

因此超时重传时间RTO计算如下:

Karm算法:在计算加权平均RTTs时,只要报文段重传了,就不采用其往返时间样本。(因为无法确定收到的确认是属于开始发送的报文段还是重传后的报文段,因此无法确定准确的往返时间)

 选择确认SACK

若收到的报文无差错,只是未按序号,使用选择确认SACK可是让发送方发送那些未收到的数据,而不重复发送已经收到的那些数据。选择确认SACK的数据放在TCP的首部选项字段里。

 TCP的流量控制

 利用滑动窗口进行流量控制

所谓流量控制,就是让发送方的发送速率不要太快,要让接收方来得及接收。利用滑动窗口,接收方向发送方发送窗口值,便可以控制发送方的发送速率。

问题:当接收方B的存储已满时,会向发送方发送零窗口的报文段,接着B的存储又有了一些空间,B再向A发送一个不为零的窗口值,但这个报文丢失了,结果就是双方一直等待下去。

为了解决以上问题,TCP为每一个连接设有一个持续计时器。只有有一方收到零窗口值的通知,就启动持续计时器。计时器时间到了后,就发送一个零窗口探测报文段,而对方就在确认这个探测报文段时给出现在的窗口值。

 必须考虑传输效率

应用程序把数据传送到TCP的发送缓存后,TCP在何时发送这些数据?

TCP中广泛使用Nagle算法,如下:

(1)若发送应用进程要把数据逐个字节地送到TCP的发送缓存,则发送方就把第一个数据字节先发出去,把后面到达的数据字节都缓存起来。

(2)方发送方收到对第一个数据字节的确认后,再把发送缓存中的所有数据组装成一个报文发送出去,同时继续对后续到来的数据进行缓存。

(3)只有收到对前一个报文段的确认后才继续发送下一个报文段。

当数据到达快而网络速度慢时,这种方法可以明显减少网络带宽。Nagle还规定:当到达的数据达到窗口的一半或最大报文长度时就立即发送一个报文。

以下为另一个问题:

若接收方的缓存已满,应用进程每次只从缓存中取1个字节,然后向发送方确认,并把窗口设为1个字节(缓存只空了1个字节的空间),接着发送方发来1个字节,接收方发回确认,仍然将窗口设为1,这样进行下去,网络的利用率很低。

解决方案:

让接收方等待一段时间,使得或者缓存已有足够的空间或者等到接收缓存已有一半的空闲空间。此时,接收方就发出确认报文,并向发送方通知当前窗口的大小。

TCP的拥塞控制

 拥塞控制的一般原理

拥塞:对网络中某一资源的需求超过了该资源所能提供的可用部分,网络性能因此变坏。

拥塞控制:防止过多的数据注入到网络中,这样可以使网络中的路由器或链路不致过载。拥塞控制的前提是网络能够承受现有的网络负荷。拥塞控制是一个全局过程,涉及到所有的主机和路由器。而流量控制往往是指点对点通信量的控制。

几种拥塞控制方法

讨论以下算法时,假定数据是单方向的,接收方的缓存空间足够大,发送窗口有拥塞程度决定。

四种算法:慢开始、拥塞避免、快重传和快恢复

慢开始和拥塞避免

发送方维持一个拥塞窗口的状态变量,其大小取决于拥塞程度,并且动态变化。发送方让自己的发送窗口小于拥塞窗口(如果考虑接收方的接收能力的话,发送窗口可能小于拥塞窗口)。

发送方控制拥塞窗口的原则是:只要网络没有拥塞,拥塞窗口就再增大一点,以便把更多的分组发送出去,只要出现拥塞,就减小拥塞窗口,以减少注入到网络的分组数。

那么发送方如何知道网络发生拥塞呢?下面将讨论拥塞窗口的大小如何变化的。先从“慢开始算法”讲起:

慢开始

当主机开始发送数据时,如果立即把大量的数据注入到网络,可能引起拥塞。因此由小逐渐增大发送窗口。通常开始发送报文时,先将拥塞窗口cwnd的值设为一个最大报文段MSS的数值。而在每收到一个新的报文段确认后,把拥塞窗口增加至多一个MSS的数值。

 

如上图,开始时cwnd=1,发送方发送一个M1,接收方收到M1发送确认,发送方收到一个确认后将cwnd加1,此时cwnd=2,因此发送方发送M2和M3两个报文段,接收方收到后返回两个确认,因此cwnd增加两次,此时cwnd=4,接着发送方发送M4~M7四个报文段。依次类推,我们发现每个轮次,cwnd都是倍增的。

防止拥塞窗口cwnd增加过大导致网络拥塞,需要设置一个慢开始门限ssthresh,慢开始门限用法如下:

当cwnd<ssthresh时,使用慢开始算法

当cwnd>ssthresh时,使用拥塞避免算法

当cwnd=ssthresh时,两种算法都可以

拥塞避免算法

该思路是让拥塞窗口cwnd缓慢增大,即每经过一个往返时间RTT(一个轮次,而不是收到一个确认报文)就把cwnd加1。该算法下的cwnd增大的速度比慢开始更缓慢。

无论在慢开始阶段还是拥塞避免阶段,只要发送方判断网络出现拥塞(根据是没有按时收到确认),立即把慢开始门限ssthresh设为出现拥塞时的发送窗口的一半。然后发送窗口cwnd重新设为1,执行慢开始算法。目的是迅速减少主机发送到网络分组的分组数。

快重传和快恢复

快重传算法要求接收方每收到一个失序的报文段后就立即发送重复确认,如上图接收了M1和M2后,又接收到一个M4,M4属于失序报文,则发送对M2的重复确认。发送方只要连续收到三次确认重复就立即重传对方未收到的报文段M3。

与快重传算法配合的还有快恢复算法,过程如下:

(1)当发送方连续收到三个重复确认时,就把慢开始门限ssthresh减半,这时为了防止网络拥塞,接着并不是执行慢开始算法。

(2)由于上图这种情况很可能不是因为网络拥塞引起的,因此这里不执行慢开始算法(即不把拥塞窗口cwnd设为1,这样速度太慢),而是把cwnd值设置为慢开始门限ssthresh减半后的数值,然后开始执行拥塞避免算法。

随机早期检测RED

网络层的策略对TCP拥塞控制最大的就是路由器的分组丢弃策略。也就是路由器的队列满了之后,会把队列尾部的数据丢弃。当网络中有很多TCP连接时,这种尾部丢弃策略会使得同一时间许多的TCP连接突然进入到慢开始状态,整个网络的通信量突然下降很多,网络恢复后,通信量又突然增大很多。

为了避免发生这种问题,可以在路由器采用随机早期检测RED,要点如下:

(1)若平均队列长度小于最小门限THmin,则把新的分组放入队列

(2)若平均队列长度大于最大门限THmax,则丢弃新的分组

(3)若队列长度处于最小门限THmin和最大门限THmax之间,则按照一定的概率p丢弃新到达的分组。

TCP的运输连接管理

 

运输连接有三个阶段:连接建立、数据传送和连接释放。

 

 TCP建立连接过程中要解决以下三个问题:

(1)要使每一方能够确知对方的存在

(2)要允许双方协商一些参数(如最大窗口值、是否使用窗口扩大选项和时间戳选项以及服务质量)

(3)能够对运输实体资源进行分配

TCP连接建立(三次握手)

(1)B的TCP服务器进程先创建传输控制块TCB,准备接收客户端的连接请求,然后服务器处于监听状态。

(2)A的TCP客户端进程创建传输控制块TCB,然后向B发送连接请求报文段,首部同步位SYN=1,ACK=0,同时选择一个初始序号seq=x。(TCP规定SYN=1的报文不能携带数据,但要消耗一个序号),这时TCP客户端进入SYN-SENT(同步已发送)状态。

(3)B收到连接请求报文后,如同意连接,则向A发送确认。确认报文段中SYN=1,ACK=1,确认号ack=x+1,同时也为自己选择一个初始序号seq=y。注意,这个报文段也不能携带数据,同时需要消耗一个序号。此时,TCP服务器进入SYN-RCVD(同步收到)状态。

(4)TCP客户端进程A收到B的确认后,还要向B给出确认。确认报文段SYN=0,ACK=1,确认号ack=y+1,而自己的序号seq=x+1。(TCP规定,ACK报文段可以携带数据,但如果不携带数据则不消耗序号,因此下一个数据报文段的序号仍是seq=x+1),这时TCP连接已经建立。A进入ESTABLISHED(已建立连接状态),当B收到A的确认后,也进入ESTABLISHED状态。

注:第三次A向B发送确认的目的是减少某些异常下B的资源损耗。试想一种情况:如果只有第一次和第二次握手,第二次B向A发送的确认丢失了,此时B进入了连接建立状态,A没有收到确认,过一段时间后会再次向B发送连接请求,B收到后又会再次建立连接,白白浪费B的资源。

 TCP的连接释放(四次握手)

在次,A和B首先都处于连接状态。

(1)A的应用进程向其TCP发送连接释放报文段,并停止再发送数据,主动关闭TCP连接。

(2)A把连接释放报文段首部的终止控制符值FIN=1,序号seq=u,seq等于前面已传送数据的最后一个字节的序号加1。这时A进入了FIN-WAIT-1(终止等待1)。注意LTCP规定,FIN报文即使不携带数据,也要消耗一个序号。

(3)B收到连接释放报文后,立即发送确认,确认号ack=u+1,而这个报文自己的序号为v,等于B前面已传送的数据的最后一个字节的序号加1。然后B进入CLOSE-WAIT(关闭等待)。TCP服务进程此时要通知高层应用进程。这时的TCP处于半连接状态,即A不会发送数据给B,但若B发送数据给A,A仍要接收。

(4)A收到B的确认后,就进入了FIN-WAIT-2(停止等待2),等待B发出连接释放报文。

(5)若B已经没有数据要发送了,则其应用进程通知TCP释放连接。这时B发送的报文段里FIN=1,假定此时B的序号为w,ack=u+1。这时B进入LAST-ACK(最后确认)。

(6)A收到B的释放连接报文段后,必须对此发出确认。确认报文段ACK=1,seq=u+1,ack=w+1。然后进入TIME-WAIT(时间等待)。经过2MSL后,进入CLOSE状态。

注:A在TIME-WAIT状态等待2MSL(MSL,最长报文段寿命),主要是因为以下两点考虑:

一:为了保证A发送的最后一个ACK报文段能够到达B,因为这个ACK报文段可能丢失,此时B会重传连接释放报文,如果A已经关闭,则无法收到这个报文。

二:A在发送完最后一个ACK报文段后,再经过时间2MSL,就可以使本连接持续时间内产生的所有报文段都从网络中消失。这样,下一个新连接中不会出现这种旧的连接请求报文段。

(7)B收到了A发送的确认报文段后,进入CLOSE状态。

posted @ 2017-03-20 14:41  且听风吟-wuchao  阅读(495)  评论(0编辑  收藏  举报