网络编程懒人入门(十三):一泡尿的时间,快速搞懂TCP和UDP的区别
本文引用了作者Fundebug的“一文搞懂TCP与UDP的区别”一文的内容,感谢无私分享。
1、引言
网络协议是每个搞网络通信应用开发(比如IM、推送、网关等等)的程序员都必须要掌握的基础知识,TCP/IP协议簇中有两个最具有代表性的传输层协议——分别是 TCP 和 UDP。
有过网络通信开发经验的同学们都知道,TCP和UDP协议是平时用的最多的两种协议,而对于很多人来说,什么时候以及什么场景下该用TCP还是UDP?这是个经久不息的讨论话题。
不同于其它长篇大论,本文尽量以简洁精炼的文字,帮你总结归纳TCP和UDP协议的主要区别,方便那些想掌握这方面知识又不愿意耗费太多时间去系统地学习网络理论基础的同学快速理解!
学习交流:
- 移动端IM开发入门文章:《新手入门一篇就够:从零开发移动端IM》
- 开源IM框架源码:https://github.com/JackJiang2011/MobileIMSDK
(本文已同步发布于:http://www.52im.net/thread-3793-1-1.html )
2、快速理解TCP/IP协议簇
计算机与网络设备要相互通信,双方就必须基于相同的方法。比如:如何探测到通信目标、由哪一边先发起通信、使用哪种语言进行通信、怎样结束通信等规则都需要事先确定。不同的硬件、操作系统之间的通信,所有的这一切都需要一种规则。而我们就把这种规则称为协议(protocol)。
TCP/IP 是互联网相关的各类协议族的总称,比如:TCP,UDP,IP,FTP,HTTP,ICMP,SMTP 等都属于 TCP/IP 族内的协议。
TCP/IP模型是互联网的基础,它是一系列网络协议的总称。这些协议可以划分为四层,分别为链路层、网络层、传输层和应用层。
具体是:
- 1)链路层:负责封装和解封装IP报文,发送和接受ARP/RARP报文等;
- 2)网络层:负责路由以及把分组报文发送给目标网络或主机;
- 3)传输层:负责对报文进行分组和重组,并以TCP或UDP协议格式封装报文;
- 4)应用层:负责向用户提供应用程序,比如HTTP、FTP、Telnet、DNS、SMTP等。
下面这张表格进行了了归纳:
下面这张图,更生动的反映了TCP/IP协议族的关系情况(高清图从这里下载):
在网络体系结构中,网络通信的建立必须是在通信双方的对等层进行,不能交错。
在整个数据传输过程中,数据在发送端时经过各层时都要附加上相应层的协议头和协议尾(仅数据链路层需要封装协议尾)部分,也就是要对数据进行协议封装,以标识对应层所用的通信协议。
有关TCP/IP协议簇的知识,几本书都写不完,这里我就不再赘述了,有兴趣可以读一读《TCP/IP详解 卷1:协议(在线阅读)》。
另外,学习知识,我特别喜欢了解技术之外的一些知识,比如下面两篇:
接下来,我们将回到正题,学习TCP/IP 中有两个具有代表性的传输层协议——TCP 和 UDP。
3、快速理解UDP协议
3.1 基本介绍
UDP协议:全称是用户数据报协议,在网络中它与TCP协议一样用于处理数据包,是一种无连接的协议。
在OSI模型中,处在第四层——传输层,处于IP协议的上一层(见下图)。
▲ 上图引用自《计算机网络通讯协议关系图》
UDP有不提供数据包分组、组装和不能对数据包进行排序的缺点,也就是说,当报文发送之后,是无法得知其是否安全完整到达的。
UDP协议的几个主要特别,我进行归纳,下面的下节将逐一说明。
3.2 面向无连接
首先 UDP 是不需要和 TCP一样在发送数据前进行三次握手建立连接的,想发数据就可以开始发送了。并且也只是数据报文的搬运工,不会对数据报文进行任何拆分和拼接操作。
具体来说就是:
- 1)在发送端:应用层将数据传递给传输层的 UDP 协议,UDP 只会给数据增加一个 UDP 头标识下是 UDP 协议,然后就传递给网络层了;
- 2)在接收端:网络层将数据传递给传输层,UDP 只去除 IP 报文头就传递给应用层,不会任何拼接操作。
3.3 支持单播、多播、广播
UDP 不止支持一对一的传输方式,同样支持一对多,多对多,多对一的方式,也就是说 UDP 提供了单播、多播、广播的功能。
3.4 面向报文
UDP协议是面向报文的。
发送方的UDP对应用程序交下来的报文,在添加首部后就向下交付IP层。UDP对应用层交下来的报文,既不合并,也不拆分,而是保留这些报文的边界。
因此,应用程序必须选择合适大小的报文(见《UDP中一个包的大小最大能多大?》)。
3.5 不可靠性
UDP的不可靠性首先体现在无连接上,通信的双方不需要建立连接,想发就发,这样的情况肯定不可靠。
并且收到什么数据就传递什么数据,并且也不会备份数据,发送数据也不会关心对方是否已经正确接收到数据了。
再者网络环境时好时坏,但是 UDP 因为没有拥塞控制,一直会以恒定的速度发送数据(即使网络条件不好,也不会对发送速率进行调整)。
这样实现的弊端就是在网络条件不好的情况下可能会导致丢包,但是优点也很明显,在某些实时性要求高的场景(比如电话会议)就需要使用 UDP 而不是 TCP(见《网络编程懒人入门(五):快速理解为什么说UDP有时比TCP更有优势》)。
下面这个动图可以很好的说明UDP的不可靠性:
从上面的动图可以得知,UDP只会把想发的数据报文一股脑的丢给对方,并不在意数据有无安全完整到达。
3.6 头部开销小
UDP协议头部开销小(如下图所示),传输数据报文时是很高效的。
▲ 上图引用自《TCP/IP详解 - 第11章·UDP协议》
UDP 头部包含了以下几个数据:
- 1)两个十六位的端口号,分别为源端口(可选字段)和目标端口;
- 2)整个数据报文的长度;
- 3)整个数据报文的检验和(IPv4 可选 字段),该字段用于发现头部信息和数据中的错误。
因此 UDP 的头部开销小,只有8字节,相比 TCP 的至少20字节要少得多,在传输数据报文时是很高效的。
作为对比,下图是TCP协议的头部开销:
▲ 上图引用自《TCP/IP详解 - 第17章·TCP协议》
3.7 更全面地学习UDP协议
UDP协议相对来说比较简单易学,如果觉得理论上有所欠缺,可以通过网络经典书籍《TCP/IP详解 - 第11章·UDP:用户数据报协议》中的章节来补充。
其实生产应用时,UDP协议也有它复杂的一面,下面这几篇值得学习一下:
另外,随着近年来Google等互联网大厂大力推广Quic协议,UDP协议在新时代移动互联网环境下或许能找到更多的应用场景,有兴趣的读者可以学习一下QUIC协议:《网络编程懒人入门(十):一泡尿的时间,快速读懂QUIC协议》、《技术扫盲:新一代基于UDP的低延时网络传输层协议——QUIC详解》、《让互联网更快:新一代QUIC协议在腾讯的技术实践分享》。
4、快速理解TCP协议
4.1 基本介绍
当一台计算机想要与另一台计算机通讯时,两台计算机之间的通信需要畅通且可靠,这样才能保证正确收发数据。
例如:当你想查看网页或查看电子邮件时,希望完整且按顺序查看网页,而不丢失任何内容。当你下载文件时,希望获得的是完整的文件,而不仅仅是文件的一部分,因为如果数据丢失或乱序,都不是你希望得到的结果,于是就用到了TCP。
TCP协议:全称是传输控制协议是一种面向连接的、可靠的、基于字节流的传输层通信协议,由 IETF 的RFC 793定义。
TCP 是面向连接的、可靠的流协议。流就是指不间断的数据结构,你可以把它想象成排水管中的水流。
有关TCP协议的理论可以继续阅读《TCP/IP详解 - 第17章·TCP:传输控制协议》,限于篇幅这里就展开了。
接下来我们逐个介绍TCP最主要的几个特点。
4.2 TCP连接过程(3次握手)
如下图所示,这是建立一个TCP连接的过程(俗称“3次握手”):
1)第一次握手:客户端向服务端发送连接请求报文段。该报文段中包含自身的数据通讯初始序号。请求发送后,客户端便进入 SYN-SENT 状态。
2)第二次握手:服务端收到连接请求报文段后,如果同意连接,则会发送一个应答,该应答中也会包含自身的数据通讯初始序号,发送完成后便进入 SYN-RECEIVED 状态。
3)第三次握手:当客户端收到连接同意的应答后,还要向服务端发送一个确认报文。客户端发完这个报文段后便进入 ESTABLISHED 状态,服务端收到这个应答后也进入 ESTABLISHED 状态,此时连接建立成功。
这里可能大家会有个疑惑:为什么 TCP 建立连接需要三次握手,而不是两次?这是因为这是为了防止出现失效的连接请求报文段被服务端接收的情况,从而产生错误。
下面的动画演示了3次握手过程,可能更好懂一些:
▲ 动图引用自《跟着动画来学TCP三次握手和四次挥手》
4.3 TCP断开链接(4次挥手)
TCP 是全双工的,如上图所示,在断开连接时两端都需要发送 FIN 和 ACK。
1)第一次挥手:若客户端 A 认为数据发送完成,则它需要向服务端 B 发送连接释放请求。
2)第二次挥手:B 收到连接释放请求后,会告诉应用层要释放 TCP 链接。然后会发送 ACK 包,并进入 CLOSE_WAIT 状态,此时表明 A 到 B 的连接已经释放,不再接收 A 发的数据了。但是因为 TCP 连接是双向的,所以 B 仍旧可以发送数据给 A。
3)第三次挥手:B 如果此时还有没发完的数据会继续发送,完毕后会向 A 发送连接释放请求,然后 B 便进入 LAST-ACK 状态。
4)第四次挥手:A 收到释放请求后,向 B 发送确认应答,此时 A 进入 TIME-WAIT 状态。该状态会持续 2MSL(最大段生存期,指报文段在网络中生存的时间,超时会被抛弃) 时间,若该时间段内没有 B 的重发请求的话,就进入 CLOSED 状态。当 B 收到确认应答后,也便进入 CLOSED 状态。
关于TCP的4次挥手,下面的动画或许更生动一些:
▲ 动图引用自《跟着动画来学TCP三次握手和四次挥手》
正确理解TCP 3次握手和4次挥手过程,是非常重要的,限于篇幅,本文没办法进一步深入展开,有兴趣的同事可以进一步深入阅读以几篇专题文章:
4.4 TCP协议要点归纳
1)面向连接:
面向连接,是指发送数据之前必须在两端建立连接。
建立连接的方法是“三次握手”,这样能建立可靠的连接。建立连接,是为数据的可靠传输打下了基础。
2)仅支持单播传输:
每条TCP传输连接只能有两个端点,只能进行点对点的数据传输,不支持多播和广播传输方式。
3)面向字节流:
TCP不像UDP一样那样一个个报文独立地传输,而是在不保留报文边界的情况下以字节流方式进行传输。
4)可靠传输:
对于可靠传输、判断丢包、误码,靠的是TCP的段编号以及确认号。
TCP为了保证报文传输的可靠,就给每个包一个序号,同时序号也保证了传送到接收端实体的包的按序接收。
然后接收端实体对已成功收到的字节发回一个相应的确认(ACK):如果发送端实体在合理的往返时延(RTT)内未收到确认,那么对应的数据(假设丢失了)将会被重传。
关于可靠传输的理论,可以深入学习《TCP/IP详解 - 第21章·TCP的超时与重传》,这里就不深入展开了。
5)提供拥塞控制:
当网络出现拥塞的时候,TCP能够减小向网络注入数据的速率和数量,缓解拥塞。
TCP中有关拥塞控制的文章通都比较枯燥,这篇《通俗易懂-深入理解TCP协议(下):RTT、滑动窗口、拥塞处理》相对来说讲的比较易懂,有兴趣可以深入读读。
6)TCP提供全双工通信:
TCP允许通信双方的应用程序在任何时候都能发送数据,因为TCP连接的两端都设有缓存,用来临时存放双向通信的数据。
当然,TCP可以立即发送一个数据段,也可以缓存一段时间以便一次发送更多的数据段(最大的数据段大小取决于MSS)。
4.5 更全面地学习TCP协议
TCP协议涉及的内容比较丰富,真要方方面面展来讲,三天三夜也讲不完。不过,对于网络应用的开发者来说,根据自已应用所涉及技术的深度按需学习就可以了。
初学者建议先把理论夯实,比如从《TCP/IP详解 - 第17章·TCP:传输控制协议》这本经典书籍开始。
如果觉得理论太过乏味,下面这几篇生动有趣的入门文章推荐一定要读一读:
- 《网络编程懒人入门(一):快速理解网络通信协议(上篇)》
- 《网络编程懒人入门(二):快速理解网络通信协议(下篇)》
- 《网络编程懒人入门(三):快速理解TCP协议一篇就够》
- 《网络编程懒人入门(六):史上最通俗的集线器、交换机、路由器功能原理入门》
- 《脑残式网络编程入门(一):跟着动画来学TCP三次握手和四次挥手》
- 《网络编程入门从未如此简单(一):假如你来设计网络,会怎么做?》
- 《网络编程入门从未如此简单(二):假如你来设计TCP协议,会怎么做?》
另外,在学习TCP或者网络编程实践的过程中,其它的一些网络知识也有必要了解,下面这几篇可以让你轻松的学习,不要错过:
- 《脑残式网络编程入门(五):每天都在用的Ping命令,它到底是什么?》
- 《脑残式网络编程入门(六):什么是公网IP和内网IP?NAT转换又是什么鬼?》
- 《脑残式网络编程入门(七):面视必备,史上最通俗计算机网络分层详解》
- 《脑残式网络编程入门(八):你真的了解127.0.0.1和0.0.0.0的区别?》
- 《脑残式网络编程入门(九):面试必考,史上最通俗大小端字节序详解》
在生产应用中,必须要涉及到网络的高性能、高并发问题,下面这几篇值得学习:
- 《高性能网络编程(一):单台服务器并发TCP连接数到底可以有多少》
- 《高性能网络编程(二):上一个10年,著名的C10K并发连接问题》
- 《高性能网络编程(三):下一个10年,是时候考虑C10M并发问题了》
- 《高性能网络编程(四):从C10K到C10M高性能网络应用的理论探索》
- 《从根上理解高性能、高并发(一):深入计算机底层,理解线程与线程池》
- 《从根上理解高性能、高并发(二):深入操作系统,理解I/O与零拷贝技术》
- 《从根上理解高性能、高并发(三):深入操作系统,彻底理解I/O多路复用》
- 《从根上理解高性能、高并发(四):深入操作系统,彻底理解同步与异步》
- 《从根上理解高性能、高并发(五):深入操作系统,理解高并发中的协程》
- 《从根上理解高性能、高并发(六):通俗易懂,高性能服务器到底是如何实现的》
- 《从根上理解高性能、高并发(七):深入操作系统,一文读懂进程、线程、协程》
随着TCP协议应用的深度不断拓展,一定会遇到各种疑难杂症:
- 《不为人知的网络编程(一):浅析TCP协议中的疑难杂症(上篇)》
- 《不为人知的网络编程(二):浅析TCP协议中的疑难杂症(下篇)》
- 《不为人知的网络编程(三):关闭TCP连接时为什么会TIME_WAIT、CLOSE_WAIT》
- 《不为人知的网络编程(四):深入研究分析TCP的异常关闭》
对于TCP协议来说,知道的越多越觉无知,下面这几篇或许可以彻底为你解开一些疑惑,不可多得:
- 《不为人知的网络编程(十):深入操作系统,从内核理解网络包的接收过程(Linux篇)》
- 《不为人知的网络编程(十一):从底层入手,深度分析TCP连接耗时的秘密》
- 《不为人知的网络编程(十二):彻底搞懂TCP协议层的KeepAlive保活机制》
- 《不为人知的网络编程(十三):深入操作系统,彻底搞懂127.0.0.1本机网络通信》
5、总结一下
TCP和UDP的区别可以归纳为下面这张表格:
简单来说,TCP和UDP的区别就是:
- 1)TCP向上层提供面向连接的可靠服务 ,UDP向上层提供无连接不可靠服务;
- 2)虽然 UDP 并没有 TCP 传输来的准确,但是也能在很多实时性要求高的地方有所作为;
- 3)对数据准确性要求高,速度可以相对较慢的,可以选用TCP。
最后,想用一张图来生动地概括一下TCP与UDP的区别:
正如上图所示:TCP就像左边的妹子——喝起水来有条不紊、滴水不漏,UDP就像右边的妹子——甭管能喝到多少、倒就完了。。。
6、系列文章
本文是系列文章中的第13篇,本系列文章的大纲如下:
[1] 网络编程懒人入门(一):快速理解网络通信协议(上篇)
[2] 网络编程懒人入门(二):快速理解网络通信协议(下篇)
[4] 网络编程懒人入门(四):快速理解TCP和UDP的差异
[5] 网络编程懒人入门(五):快速理解为什么说UDP有时比TCP更有优势
[6] 网络编程懒人入门(六):史上最通俗的集线器、交换机、路由器功能原理入门
[7] 网络编程懒人入门(七):深入浅出,全面理解HTTP协议
[8] 网络编程懒人入门(八):手把手教你写基于TCP的Socket长连接
[9] 网络编程懒人入门(九):通俗讲解,有了IP地址,为何还要用MAC地址?
[11] 网络编程懒人入门(十):一泡尿的时间,快速读懂QUIC协议
[13] 网络编程懒人入门(十二):快速读懂Http/3协议,一篇就够!
[14] 网络编程懒人入门(十三):一泡尿的时间,快速搞懂TCP和UDP的区别(* 本文)
(本文已同步发布于:http://www.52im.net/thread-3793-1-1.html )
作者:Jack Jiang (点击作者姓名进入Github)
出处:http://www.52im.net/space-uid-1.html
交流:欢迎加入即时通讯开发交流群 215477170
讨论:http://www.52im.net/
Jack Jiang同时是【原创Java
Swing外观工程BeautyEye】和【轻量级开源移动端即时通讯框架MobileIMSDK】的作者,可前往下载交流。
本博文
欢迎转载,转载请注明出处(也可前往 我的52im.net 找到我)。