网络通信协议(一)
就我们做业务开发的人很容易想到一个东西就是TCP/IP协议,但其实吧,要了解这些东西的产生的原因是一件很有意思的事情。准确的说TCP/IP只是一种网络通信协议。除了它还有很多的协议,例如NetBEUI协议,NWLink IPX/SPX/NetBIOS,DLC协议,AppleTalk协议,IrDA协议等。我其实也很混乱,先放个大图理一理思路。
就准确的说TCP/IP其实是OSI协议的整合,OSI是一个七层的架构思想,TCP/IP是一个四层的,但是这四层已经包含了7层里面应该有的东西。OSI 参考模型注重“通信协议必要的功能是什么”,而 TCP/IP 则更强调“在计算机上实现协议应该开发哪种程序”。
TCP/IP的流程:
在最上层的应用层将一串应用数据流传送给传输层
传输层将数据进行分段,并加上TCP报文头形成TCP段发送至网络层
网络层给TCP段加上源,目的主机IP地址的IP报头,生成一个IP数据包,然后发送到链路层。
链路层在其MAC帧的数据部分装上IP数据包,再加上源、目的主机的MAC地址和帧头,并根据其目的MAC地址,将MAC帧发往目的主机或IP路由器。
TCP报文头的特点(这边只是讲TCP,还有UDP等,不同的种类,特点不同)
1、点对点(不能广播、多播),面向连接
2、双向传递(全双工)
3、字节流:打包成报文段、保证有序接收、重复报文自动丢弃
缺点:不维护应用报文的边界(需要HTTP协议自己定义/r/n或content length进行结尾、GRPC)
优点:不强制要求应用必须离散的创建数据块,不限制数据块大小
4、流量缓存:解决速度不匹配问题(滑动窗口)
5、可靠的传输服务(保证可达,丢包时通过重发进而增加时延实现可靠性)
6、拥塞控制
下图为TCP的报文头。源端口就是平时开发中的8080,这种端口。在一台电脑上端口共有2的16次=65535个。所以在这边的源端口是以二进制的方式进行表示的。目的端口也一样的。
序号:表示本报文段所发送数据的第一个字节的编号。在TCP连接中所传送的字节流的每一个字节都会按顺序编号。由于序列号由32位表示,所以每2^32个字节,就会出现序列号回绕,再次从0开始
确认号:表示接收方期望收到发送方下一个报文段的第一个字节数据的编号。也就是告诉发送方:我希望你(指发送方)下次发送的数据的第一个字节数据的编号为此确认号
数据偏移:表示TCP报文段的首部长度,共4位,由于TCP首部包含一个长度可变的选项部分,需要指定这个TCP报文段到底有多长。它指出 TCP 报文段的数据起始处距离 TCP 报文段的起始处有多远。该字段的单位是32位(即4个字节为计算单位),4位二进制最大表示15,所以数据偏移也就是TCP首部最大60字节,通过这个可以轻松的划分出报文头和具体的数据。
URG:表示本报文段中发送的数据是否包含紧急数据。后面的紧急指针字段(urgent pointer)只有当URG=1时才有效。注意:2011-01, TCP的紧急数据已经是废弃的功能了。不建议新的应用程序使用,只为旧程序兼容而存在。
ACK:表示是否前面确认号字段是否有效。只有当ACK=1时,前面的确认号字段才有效。TCP规定,连接建立后,ACK必须为1,带ACK标志的TCP报文段称为确认报文段,这个也是基本都知道的,也广泛运用在RPC,分布式的设计中。
PSH:提示接收端应用程序应该立即从TCP接收缓冲区中读走数据,为接收后续数据腾出空间。如果为1,则表示对方应当立即把数据提交给上层应用,而不是缓存起来,如果应用程序不将接收到的数据读走,就会一直停留在TCP接收缓冲区中。
RST:如果收到一个RST=1的报文,说明与主机的连接出现了严重错误(如主机崩溃),必须释放连接,然后再重新建立连接。或者说明上次发送给主机的数据有问题,主机拒绝响应,带RST标志的TCP报文段称为复位报文段。
SYN:在建立连接时使用,用来同步序号。当SYN=1,ACK=0时,表示这是一个请求建立连接的报文段;当SYN=1,ACK=1时,表示对方同意建立连接。SYN=1,说明这是一个请求
建立连接或同意建立连接的报文。只有在前两次握手中SYN才置为1,带SYN标志的TCP报文段称为同步报文段。
FIN:表示通知对方本端要关闭连接了,标记数据是否发送完毕。如果FIN=1,即告诉对方:“我的数据已经发送完毕,你可以释放连接了”,带FIN标志的TCP报文段称为结束报文段。
窗口大小:表示现在允许对方发送的数据量,也就是告诉对方,从本报文段的确认号开始允许对方发送的数据量,达到此值,需要ACK确认后才能再继续传送后面数据,由Window size value * Window size scaling factor(此值在三次握手阶段TCP选项Window scale协商得到)得出此值。
紧急指针:标记紧急数据在数据字段中的位置