一. 对上一互联网学习笔记的小结
由前一学习,我们知道,网络通信就是交换数据包。电脑A 向电脑B发送一个数据包,电脑B收到这个数据包后,回复一个数据包,从而实现两台电脑之间的通信。
数据包的结构,基本上是下面这样:
发送这个包,需要知道两个地址:
对方的 MAC 地址
对方的 IP 地址
有了这两个地址,数据包才能准确送到接收者手上。但是前面说过,MAC地址有局限性,如果两台电脑不在同一个子网络,就无法知道对方的MAC地址,必须通过网关(gateway)转发。
上图中,1号电脑要向 4 号电脑发送一个数据包。它先判断 4 号电脑是否在同一个子网络,结果发现不是(后文介绍判断方法),于是就把这个数据包发到网关A。网关A通过路由协议,发现 4 号
电脑位于子网络B,又把数据包发给网关B,网关B再转发到 4 号电脑。
1号电脑把数据包发到网关A,必须知道网关A的 MAC 地址。所以,数据包的目标地址,实际上分成两种情况:
场景 | 数据包地址 |
同一个子网络 | 对方的 MAC 地址,对方的 IP 地址 |
非同一个子网络 | 网关的 MAC 地址,对方的 IP 地址 |
发送数据包之前,电脑必须判断对方是否在同一个子网络,然后选择相应的 MAC 地址。接下来,我们就来看,实际使用中,这个过程是怎么完成的。
二. 用户的上网设置
1. 静态IP设置
你买了一台新电脑,插上网线,开机,这样就能上网了吗?
通常你必须做一些设置。有时,管理员(或者ISP)会告诉你下面四个参数,你把它们填入操作系统,计算机就能连上网来了。
本机的IP地址
子网掩码
网关的IP地址
DNS的IP地址
下图是Windows系统的设置窗口:
这四个参数缺一不可,后文会解释为什么需要知道它们才能上网。由于它们是给定的,计算机每次开机,都会分到同样的 IP 地址,所以这种情况被称作"静态 IP 地址上网"。
但是,这样的设置很专业,普通的用户望而生畏。而且,如果一台电脑的IP地址保持不变,其他的电脑就不能够使用这个地址,不够灵活。出于这个原因,大多数用户使用
“动态IP地址上网”。
2. 动态IP地址
所谓“动态IP地址”,是指计算机开机后,会自动分配到一个IP地址,不用人为设定。它使用的协议叫做DHCP协议。
这个协议规定,每一个子网络中,有一台计算机负责管理本网络的所有IP地址,它叫做“DHCP服务器”。新的计算机加入网络,必须向“DHCP服务器”服务器发送一个“DHCP请求”数据包,
申请IP地址和相关的网络参数。
前面说过,如果两台计算机在同一个子网络,必须知道对方的MAC地址和IP地址,才能发送数据包。但是,新加入的计算机不知道这两个地址怎么发送数据包呢?
DHCP协议做了一些巧妙的规定。
3. DHCP协议
首先,它是一种应用层协议,建立在UDP协议只上,所以整个数据包是这样的:
(1)最前面的"以太网标头",设置发出方(本机)的 MAC 地址和接收方(DHCP 服务器)的 MAC 地址。前者就是本机网卡的 MAC 地址,后者这时不知道,就填入一个广播地址:FF-FF-FF-FF-FF-FF。
(2)后面的“IP标头”,设置发出方(本机)的IP地址和接收方的IP地址。这时,对于这两者,本机都不知道。于是,发出方的IP地址就设为0.0.0.0,接收方的IP地址就设为255.255.255.255.
(3)最后的“UDP标头“,设置发出方的端口和接收方的端口,这一部分是DHCP协议规定好的,发出方的端口号是68,接收方的端口号是67.
这个数据包构造完成后就可以发出了。以太网是广播发送,同一个子网络的每一台计算机都能收到这个数据包。因为接收方的MAC地址是FF:FF:FF:FF:FF:FF,看不出是发给谁的,所以每台收到这个包的计算机,
还必须分析这个包的IP地址,才能确定是不是发给自己的。当看到发出方的IP地址是0.0.0.0,接收方的IP地址是255.255.255.255,DHCP服务器就知道“这个包是发给我的”,而其他计算机就可以丢弃这个包了。
接下来,DHCP服务器,读出这个包的数据内容,分配好IP地址,发送回去一个“DHCP响应”数据包,这个数据包的结构也类似。以太网标头的MAC地址是是双方的网卡地址,IP标头的IP地址,是DHCP服务器(发送方)
的IP地址和255.255.255.255(接收方),UDP标头的端口地址是67(发出方)和68(接收方),分配给请求端的IP地址和相关的网络参数则包含在data部分。
新加入的计算机收到这个数据包,就知道了自己的IP地址,子网掩码,网关的IP地址,DNS的IP地址等参数。
4. 小结
不管是静态IP地址还是动态IP地址,电脑上网的首要步骤是确定四个参数:
本机的IP地址
子网掩码
网关的IP地址
DNS的IP地址
三. 一个例子
下面来看看,用户访问一个网页的时候,互联网协议是如何运作的。
1.本即参数
假定通过上一节的介绍,用户已经设置好了自己的网络参数:
本机的IP地址:192.168.1.100
子网掩码:255.255.255.0
网关的IP地址:192.168.1.1
DNS的IP地址:8.8.8.8
然后他打开浏览器,想访问Google,在地址栏输入了网址:www.google.com
这意味着,浏览器要向 Google 发送一个网页请求的数据包。
2.DNS 协议
我们知道,发送数据包,必须要知道对方的IP地址,但现在我们只知道它的网址www.google.com,不知道它的IP地址。
DNS协议可以帮助我们,把这个网址转换成IP地址。
已知DNS服务器的IP地址是8.8.8.8,我们向这个地址发送一个DNS数据包(53端口)。
然后,DNS 服务器做出响应,告诉我们 Google 的 IP 地址是 172.194.72.105。于是,我们知道了对方的 IP 地址。
3. 子网掩码
接下来,我们要判断,这个IP地址是不是在同一个子网络,这就要用到子网掩码。
已知子网掩码是255.255.255.0,本机用它对自己的IP地址192.168.1.100做一个二进制的AND运算(两个位数相同,结果为1,否则为0),计算结果为192.168.1.0;然后对Google的IP地址172.195.72.105
也做一个AND运算,计算结果为172.195.72.0。这两个结果不相等,所以本机和Google不在同一个子网络。
因此,我们要向Google发送数据包,必须要通过网关192.168.1.1转发,也就是说,接收方的MAC地址将是网关的MAC地址。
4. 应用层协议
浏览网页用的是HTTP协议,它的整个数据包结构是这样的;
HTTP 部分的内容,类似于下面这样:
GET / HTTP/1.1
Host: www.google.com
Connection: keep-alive
User-Agent: Mozilla/5.0 (Windows NT 6.1) ......
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding: gzip,deflate,sdch
Accept-Language: zh-CN,zh;q=0.8
Accept-Charset: GBK,utf-8;q=0.7,*;q=0.3
Cookie: ... ...
我们假定这个部分的长度为 4960 字节,它会被嵌在 TCP 数据包之中。
5. TCP协议
TCP数据包需要设置端口,接收方(Google)的HTTP端口默认为80,发送方(本机)的端口是一个随机生成的1024到65535之间的整数,假定为51775.
TCP数据包的标头默认为20字节,加上嵌入http的数据包,总长度为4980字节。
6. IP协议
TCP数据包再嵌入IP数据包。IP数据包需要设置双方的IP地址,这是已知的,发送方(本机)是192.168.1.100,接收方(Google)是172.194.72.105.
IP数据包的标头为20字节,加上嵌入的TCP数据包,总长度变为5000字节。
7. 以太网协议
最后,IP数据包嵌入以太网的数据包,以太网的数据包需要这只双方的MAC地址,发送方为本机的网卡MAC地址,接收方为网关192.168.1.100的MAC地址(通过ARP协议得到)。
以太网数据包的数据部分,最大长度为1500字节,而现在的IP数据包长度为5000字节,因此,IP数据包必须分割成四个包。因为每个包都有自己的IP标头(20)字节,所以四个包的IP数据包的长度
分别为1500,1500,1500,560
8. 服务器端响应
经过多个网关的转发,Google 的服务器 172.194.72.105,收到了这四个以太网数据包。
根据 IP 标头的序号,Google 将四个包拼起来,取出完整的 TCP 数据包,然后读出里面的"HTTP 请求",接着做出"HTTP 响应",再用 TCP 协议发回来。
本机收到 HTTP 响应以后,就可以将网页显示出来,完成一次网络通信。