TCP协议学习笔记
TCP协议数据格式
TCP协议在互联网ISO协议的传输层。
在互联网传输过程中,互联网包在数据链路层,是传输数据的最基础的包。一个互联网的包包含IP包,即互联网包 = 互联网信息包头(至少20字节)+IP包(1480字节) = 数据包1500字节
IP包是跨局域网传输需要路由的包,是处于网络层的包。一个IP包包含一个TCP或UDP的包,即IP包 = IP包头(至少20个字节)+TCP包(1460字节)= 数据包1480字节
TCP包是传输到指定端口的包,每个端口都表示不同的应用协议服务,TCP协议指定了端口,才能解析数据内容,例如http协议就是8080端口解析的。TCP包处于传输层。一个TCP包 =
TCP包头(至少20字节)+HTTP包(1440字节) = 1460字节。
所以一个TCP包的信息内容在1400字节左右,如果TCP的内容数据是1500字节,发送方就需要发送两个TCP包。HTTP协议因此缩短了HTTP包头,让一个HTTP包只需要一个TCP包传输。
例如一个10M的信息,需要发送7489个数据包。
TCP包的包头信息
TCP协议为了保证数据包之间按照顺序发送,每个TCP包都有一个编号,如上10M的信息需要的包里有1-7489的编号。
每一个TCP包头,传递的信息有三个。
一是编号,表示TCP当前的包所在的顺序,也是唯一标识。
二是发送方需要的下一个数据包的编号,表示接收方回复的TCP数据包中的编号是发送方请求的下一个数据包的编号。所以,在接受方丢失了这个包后,发送给对方的请求编号
便不是发送方请求的包编号。
例如 A 端------------------------------------TCP(id =1 ,ack = 100,length = 100kb)-----------------------------------------------》 B端 ACK = 1
A 端------------------------------------TCP(id =101 ,ack = 200, length = 50kb)---------------------------------------------》(包丢失) B端 ACK = 101
A 端------------------------------------TCP(id =151, ack = 300,length = 100kb)---------------------------------------------》 B端 ACK = 101
A 端的发送窗口=3,即一次性发送3个数据包,第二个数据没有收到,所以B端的ACK不会改变。所以TCP的A端会收到相同的ACK 请求。
A 端 《---------------------------------TCP(id = 100,ack = 101, length = 100kb)-------------------------------------------- B端
A 端 《---------------------------------TCP(id = 300,ack = 101, length = 100kb)-------------------------------------------- B端
这样A端会堆积很多重复的ACK,当ACK重复三次后,A端会重新发送丢失的包。
A 端------------------------------------TCP(id =101 , ack = 200, length = 50kb)---------------------------------------------》 B端 ACK = 151
A 端------------------------------------TCP(id =151 , ack = 300,length = 100kb)---------------------------------------------》 B端 ACK = 251
因此,TCP可以保证包不会丢失。
TCP的传输过程
举一个例子:
A 端 ------------------------------------TCP(id =1 ,ack = 101,length = 100kb)-----------------------------------------------》 B端 ACK = 1
A 端 《---------------------------------TCP(id = 101,ack = 101, length = 100kb)------------------------------------------------ B端
A 端 ------------------------------------TCP(id =101 ,ack = 201, length = 50kb)-----------------------------------------------》 B端 ACK = 101
A 端 《---------------------------------TCP(id = 201,ack = 151, length = 100kb)------------------------------------------------- B端
A 端 ------------------------------------TCP(id =151, ack = 301,length = 100kb)---------------------------------------------》 B端 ACK = 101
A 端 《---------------------------------TCP(id = 301,ack = 251, length = 100kb)-------------------------------------------------- B端
第一条数据包 A端发送给B端的数据编号为1,长度是100字节,第二条数据B端回复A端发送101编号的数据,因此第三A端发送的数据是101开头,且50字节的编号,
第四条数据包 B端再次请求A端给我后续151开头的数据。第五条数据包中A端果然发送给151开头大小为100字节的数据了。最后B端ACK请求251开头的数据。
ACK是什么
在LINUX中,每当发送方发送10个数据包后,会停下来等待接收方的确认。一般接收方每接到2个数据包会发送一个确认消息 Acknowledgment 即为ACK,是确认的意思。
ACK里面包含两个消息:
一是期待接收下一个数据包的编号。
二是接收方的接收窗口的剩余容量。
当发送方获取到这两个信息后,就会知道下一个发送的数据以及发送的数据包的大小,即发送速率。
例如
Client ----------------Segment(seqNum = 300,length = 100)--------------->Server
Client <--------------Acknowledgment(Acknum = 401,Window=60)------>Server
Client ----------------Segment(seqNum = 401,length = 60)--------------->Server
Client <--------------Acknowledgment(Acknum = 461,Window=80)------>Server
Client ----------------Segment(seqNum = 541,length = 100)--------------->Server
Client <--------------Acknowledgment(Acknum = 641,Window=60)------>Server
因为TCP通信是双方的,所以ACK数据是双方都发送的,所以双方的发送窗口大小不同。而且ACK的字段很小,通常和数据包合并在一起发送。
慢启动
在网络传输过程中,最理想的情况当然是传的越快越好,最好一次性发出去。但是网络的情况不稳定,有可能出现低带宽、路由过热、内存溢出的情况,导致丢包。
线路不好的情况下,发的越快,丢的越多。
所以最理想的情况是在线路允许的情况下,达到最高速率。
但是我们如何知道在什么情况下才是理想的速率呢?答案是慢慢试。
TCP协议为了做到效率和可靠性的统一,设计了一个慢启动的机制。
开始的时候,发送的慢,然后根据丢包的概率,调整速率:如果不丢包,就加快发送速率,如果丢包,就降低发送速率.
一般最开始时一次性发送10个数据包.即发送窗口 = 10.
通过ACK机制发现丢包率,进而实现慢启动机制的设计.
TCP数据包的组装
TCP的数据包传输到接收方后,组装还是由原装操作系统完成的.对于应用程序而言,不关心实现网络通信的细节.除非线路异常,收到的数据总是完整的.
应用程序需要的数据放在TCP数据包里,有自己完整的格式.
TCP并没有完整的协议来标识数据的大小,这由应用层的协议来规定,例如HTTP协议就有一个头信息Content-Length,表示信息体的大小.对于操作系统来说,
就是持续的组装数据包,按照顺序排列好,一个包都不能少.
操作系统不会去处理TCP包里面的数据,一旦组装好TCP数据包,就把它转交给应用程序,TCP数据包里有一个端口参数,就是用来转交给指定的应用程序的.
系统根据TCP数据包里的端口,将组装好的数据转交给应用程序,应用程序收到组装好的原始数据,以浏览器为例,就会根据HTTP协议里的Content-Length字段
正确读取一段段的数据.
TCP数据包编号(SEQ)
一段数据量很大的数据,需要用许多TCP包,例如一个10M的信息,需要7348个TCP数据包才能传输完.为了确认每一个TCP包传送成功,TCP数据包设计了数据包编号(SEQ),
数据包编号是一串随机数字,作为丢包的唯一标识.