Android网络编程系列 一 TCP/IP协议族
在学习和使用Android网路编程时,我们接触的仅仅是上层协议和接口如Apache的httpclient或者Android自带的httpURlconnection等等。对于这些接口的底层实现我们也有必要进一步的了解,这就要我们了解网络通信层了,提到网络通信层不得不说起ISO-OSI的七层协议经典架构,如图所示:
上图的左边部分就是osi架构模型了, ISO/OSI模型,即开放式通信系统互联参考模型(Open System Interconnection Reference Model),是国际标准化组织(ISO)提出的一个试图使各种计算机在世界范围内互连为网络的标准框架,简称OSI。图最右边则是TCP/IP协议模型了,TCP/IP协议模型(Transmission Control Protocol/Internet Protocol),包含了一系列构成互联网基础的网络协议(对应上图的中间部分),是Internet的核心协议,通过20多年的发展已日渐成熟,并被广泛应用于局域网和广域网中,目前已成为事实上的国际标准。TCP/IP协议簇是一组不同层次上的多个协议的组合,通常被认为是一个四层协议系统,与OSI的七层模型相对应。所以平常我们所提起的tcp/ip协议它并不是指一个具体的协议而是一个网络传输协议集合模型的统称。对应于标准的osi模型它制定了自己的四层协议系统,每一层都包含了多个不同的通信协议。
那么TCP/IP到底是怎样工作的又为什么需要它呢?在世界上各地,各种各样的电脑运行着各自不同的操作系统为大家服务,这些电脑在表达同一种信息的时候所使用的方法是千差万别。就好像圣经中上帝打乱了各地人的口音,让他们无法合作一样。计算机使用者意识到,计算机只是单兵作战并不会发挥太大的作用。只有把它们联合起来,电脑才会发挥出它最大的潜力。于是人们就想方设法的用电线把电脑连接到了一起。但是简单的连到一起是远远不够的,就好像语言不同的两个人互相见了面,完全不能交流信息。因而他们需要定义一些共通的东西来进行交流,TCP/IP就是为此而生。
下面我们就来看下具体的TCP/IP协议系统的分层,如图:
看到上面层次图,如果你之前有了解过,可能会读上面的Socket抽象层表示疑惑,不打紧后面会介绍。我们可以看到TCP/IP层共四层:链路层、网络层、运输层以及应用层,概念上是没有上图中的socket抽象层。
(1). 链路层
也称作数据链路层或网络接口层(在第一个图中为网络接口层和硬件层),通常包括操作系统中的设备驱动程序和计算机中对应的网络接口卡。它们一起处理与电缆(或其他任何传输媒介)的物理接口细节。ARP(地址解析协议)和RARP(逆地址解析协议)是某些网络接口(如以太网和令牌环网)使用的特殊协议,用来转换IP层和网络接口层使用的地址。具体的细节可以转到这边文章《Android网络编程系列 一 TCP/IP协议族之链路层》
(2). 网络层
也称作互联网层(在第一个图中为网际层),处理分组在网络中的活动,例如分组的选路。在TCP/IP协议族中,网络层协议包括IP协议(网际协议),ICMP协议(Internet互联网控制报文协议),以及IGMP协议(Internet组管理协议)。
IP是一种网络层协议,提供的是一种不可靠的服务,它只是尽可能快地把分组从源结点送到目的结点,但是并不提供任何可靠性保证。同时被TCP和UDP使用。TCP和UDP的每组数据都通过端系统和每个中间路由器中的IP层在互联网中进行传输。
ICMP是IP协议的附属协议。IP层用它来与其他主机或路由器交换错误报文和其他重要信息。
IGMP是Internet组管理协议。它用来把一个UDP数据报多播到多个主机。
具体的细节可以转到这边文章《Android网络编程系列 一 TCP/IP协议族之网际层》
(3). 传输层
主要为两台主机上的应用程序提供端到端的通信。在TCP/IP协议族中,有两个互不相同的传输协议:TCP(传输控制协议)和UDP(用户数据报协议)。
TCP为两台主机提供高可靠性的数据通信。它所做的工作包括把应用程序交给它的数据分成合适的小块交给下面的网络层,确认接收到的分组,设置发送最后确认分组的超时时钟等。由于运输层提供了高可靠性的端到端的通信,因此应用层可以忽略所有这些细节。为了提供可靠的服务,TCP采用了超时重传、发送和接收端到端的确认分组等机制。
UDP则为应用层提供一种非常简单的服务。它只是把称作数据报的分组从一台主机发送到另一台主机,但并不保证该数据报能到达另一端。一个数据报是指从发送方传输到接收方的一个信息单元(例如,发送方指定的一定字节数的信息)。UDP协议任何必需的可靠性必须由应用层来提供。
具体的细节可以转到这边文章《Android网络编程系列 一 TCP/IP协议族之传输层》
(4). 应用层
应用层负责处理特定的应用程序细节。
(5). socket抽象层
对于上图中显示 socket抽象层 这是一个很重要的 层次,是直接负责应用层和传输层通信的,它的作用就是使得上层(应用层)通信更方便更安全。实则就是对传输层的封装对应用层的接口提供,这里现就不扩展了,下一篇文章将重点介绍 socket抽象层
。
TCP/IP协议系统的每一层在数据传输工作中分工都很明确,我们可以看其数据通信图:
首先,是最上层的应用层,用户将应用数据通过应用层协议如http、ftp等封装好必要的客户端数据信息传递到下一层(传输层),这时候传输层的tcp或udp协议就会为其携带上客户端端口等信息。封装好了接着传递到网际层,在这里就会为数据携带上客户端的IP等信息。再接着讲数据发送到链路层,这一层为待传送的数据加入一个以太网协议头,并进行CRC编码,为最后的数据传输做准备同时还为数据携带了目标主机的mac地址(每个以太网卡mac地址都是唯一的)。再往下则是硬件层次了,负责网络的传输,这个层次的定义包括网线的制式,网卡的定义等等.
了解了数据发送,接下了看看目标主机对数据的接收过程,如下图:
上面提到了客户机在传输数据在链路层会为数据携带上目标主机的mac地址,所有就可以根据这个数据携带的IP地址和mac地址在互联网中寻找到当目的主机,接着当目标主机收到一个以太网数据帧时,数据就开始从协议栈中由底向上升,同时去掉各层协议加上的报文首部。每层协议盒都要去检查报文首部中的协议标识,以确定接收数据的上层协议。这个过程称作分用(Demultiplexing)。协议是通过目的端口号、源I P地址和源端口号进行解包的。
以上呢就是关于TCP/IP协议通信的大致流程了,接下来为了更好的吸收和理解这些知识点,你有必要了解以下基本概念:
-
ip地址
网络上每一个节点都必须有一个独立的Internet地址(也叫做IP地址)。现在,通常使用的IP地址是一个32bit的数字,也就是我们常说的IPv4标准,这32bit的数字分成四组,也就是常见的255.255.255.255的样式。IPv4标准上,地址被分为五类,我们常用的是B类地址。具体的分类请参考其他文档。需要注意的是IP地址是网络号+主机号的组合,这非常重要。
-
DNS
域名系统是一个分布的数据库,它提供将主机名(就是网址啦)转换成IP地址的服务。 DNS 是计算机域名系统 (Domain Name System 或Domain Name Service) 的缩写,它是由解析器以及域名服务器组成的。域名服务器是指保存有该网络中所有主机的域名和对应IP地址,并具有将域名转换为IP地址功能的服务器。
-
RFC
RFC是什么?RFC就是tcp/ip协议的标准文档,在这里我们可以看到RFC那长长的定义列表,现在它一共有4000多个协议的定义,当然,我们所要学习的,也就是那么十几个协议而已。
-
端口号(port)
注意,这个号码是用在TCP,UDP上的一个逻辑号码,用于区别开主机上不同应用程序。服务器一般都是通过知名端口号来识别的。例如,对于每个TCP/IP实现来说,FTP服务器的TCP端口号都是21,每个Telnet服务器的TCP端口号都是23,每个TFTP (简单文件传送协议)服务器的UDP端口号都是69。任何TCP/IP实现所提供的服务都用知名的1~1023之间的端口号。这些知名端口号由Internet号分配机构(Internet Assigned Numbers Authority, IANA)来管理。知名端口号介于1~255之间;256~1023之间的端口号通常都是由Unix系统占用,以提供一些特定的Unix服务;1024~5000端口号用于客户端分配临时端口号;大于5000的端口号是为其他服务器预留的。
-
应用编程接口
现在常用的编程接口有socket和TLI。这就是上面所提到socket抽象层。