计算机基础系列之网络基础——网络协议
what's the 网络协议?
一台拥有硬件、操作系统和软件的计算机已经具备可以使用的功能,但要实现计算机与计算机之间的通讯,还要遵循一系列的标准,这个标准就叫做互联网协议。互联网协议的功能是定义计算机如何接入Internet以及接入Internet的计算机通信的标准。
互联网协议按照功能不同分为osi七层协议或tcp/ip五层(其实只要掌握tcp/ip五层就足够在小伙伴面前装逼了)。
tcp/ip五层指的是物理层、数据链路层、网络层、传输层和应用层。
物理层基本就是指物理接口,这样计算机才能接入Internet,实现计算机之间的交流。物理层的功能是基于电特性发送高低电压,高电压对应数字1,低电压对应数字0(即二进制中的10101010)。
数字链路层的功能是定义电信号的分组方式。其中以太网协议规定了一组电信号构成一个数据包,数据包分为报头head和数据data两部分。报头head包含的内容是源地址、目标地址和数据类型。如果两台计算机处于同一个网络环境下(即处于同一个局域网),计算机A通过广播方式将数据包发出,数据包中的报头含有自己的mac地址和目标计算机B的IP地址,B收到后识别出目标IP地址是自己的IP地址,确认无误后发送一个数据包给A,其中报头中含有自己的mac地址,在两台电脑互相了解到对方的mac地址后,两台计算机就可以进行通讯了。这种互相了解的方式即ARP协议。
网络层的功能是引入一套新的地址用来区分不同的局域网,即网络地址。该功能遵循IP协议。网络层可以实现不同局域网下两台计算机之间的交流,处理方式与ARP协议大同小异,不过在中间加了网关的IP,以实现两台计算机之间互相确认mac地址。
网页服务默认都是80端口,如百度www.baidu.com:80
uri地址分为三个部分:
协议部分:http://
域名部分:即我们熟悉的网站的名字,通过域名可以得到服务器的ip地址
资源部分:即我们打开链接后除去协议部分域名部分剩下的内容
联网后可通过dhcp协议获取ip地址、网关地址、DNS地址等等。
用户使用的应用程序都位于应用层,应用层的功能是规定应用程序的数据格式。
上图即发送数据的一个过程,由上至下为用户层、传输层、网络层、数据链路层和物理层。上一层的数据到达本层后成为本层的数据,加上本层的报头后传给下一层;下一层接收数据后将含有报头的数据视为本层的数据,再次加入本层的报头。最后的数据只有一个报头,通过物理接口发送给接收者,接收者再逐层进行拆包。
socket
我们知道两个进程如果需要进行通讯最基本的一个前提能能够唯一的标示一个进程,在本地进程通讯中我们可以使用PID来唯一标示一个进程,但PID只在本地唯一,网络中的两个进程PID冲突几率很大,这时候我们需要另辟它径了,我们知道IP层的ip地址可以唯一标示主机,而TCP层协议和端口号可以唯一标示主机的一个进程,这样我们可以利用ip地址+协议+端口号唯一标示网络中的一个进程。
能够唯一标示网络中的进程后,它们就可以利用socket进行通信了,什么是socket呢?我们经常把socket翻译为套接字,socket是在应用层和传输层之间的一个抽象层,它把TCP/IP层复杂的操作抽象为几个简单的接口供应用层调用已实现进程在网络中通信。
注:有关于socket的知识后期会有一个关于socket网络编程的博客进行详细叙述,这里只是提一小嘴
网络通信的流程
1.本机获取(主机需要具备的四个要素)
- 本机的IP地址
- 子网掩码
- 网关的IP地址
- DNS的IP地址
获取这四个要素有两种方式:
静态获取:即手动输入配置
动态获取:通过dhcp协议获取
以太网头 | ip头 | udp头 | dhcp数据包 |
(1)最前面的”以太网标头”,设置发出方(本机)的MAC地址和接收方(DHCP服务器)的MAC地址。前者就是本机网卡的MAC地址,后者这时不知道,就填入一个广播地址:FF-FF-FF-FF-FF-FF。
(2)后面的”IP标头”,设置发出方的IP地址和接收方的IP地址。这时,对于这两者,本机都不知道。于是,发出方的IP地址就设为0.0.0.0,接收方的IP地址设为255.255.255.255。
(3)最后的”UDP标头”,设置发出方的端口和接收方的端口。这一部分是DHCP协议规定好的,发出方是68端口,接收方是67端口。
这个数据包构造完成后,就可以发出了。以太网是广播发送,同一个子网络的每台计算机都收到了这个包。因为接收方的MAC地址是FF-FF-FF-FF-FF-FF,看不出是发给谁的,所以每台收到这个包的计算机,还必须分析这个包的IP地址,才能确定是不是发给自己的。当看到发出方IP地址是0.0.0.0,接收方是255.255.255.255,于是DHCP服务器知道”这个包是发给我的”,而其他计算机就可以丢弃这个包。接下来,DHCP服务器读出这个包的数据内容,分配好IP地址,发送回去一个”DHCP响应”数据包。这个响应包的结构也是类似的,以太网标头的MAC地址是双方的网卡地址,IP标头的IP地址是DHCP服务器的IP地址(发出方)和255.255.255.255(接收方),UDP标头的端口是67(发出方)和68(接收方),分配给请求端的IP地址和本网络的具体参数则包含在Data部分。
新加入的计算机收到这个响应包,于是就知道了自己的IP地址、子网掩码、网关地址、DNS服务器等等参数
2.打开浏览器,想要访问Google,在地址栏输入了网址:www.google.com。
3.dns协议(基于udp协议)
顶级域名:以.com,.net,.org,.cn等等属于国际顶级域名,根据目前的国际互联网域名体系,国际顶级域名分为两类:类别顶级域名(gTLD)和地理顶级域名(ccTLD)两种。类别顶级域名是以"COM"、"NET"、"ORG"、"BIZ"、"INFO"等结尾的域名,均由国外公司负责管理。地理顶级域名是以国家或地区代码为结尾的域名,如"CN"代表中国,"UK"代表英国。地理顶级域名一般由各个国家或地区负责管理。
二级域名:二级域名是以顶级域名为基础的地理域名,比喻中国的二级域有,.com.cn,.net.cn,.org.cn,.gd.cn等.子域名是其父域名的子域名,比喻父域名是abc.com,子域名就是www.abc.com或者*.abc.com.
一般来说,二级域名是域名的一条记录,比如alidiedie.com是一个域名,www.alidiedie.com是其中比较常用的记录,一般默认是用这个,但是类似*.alidiedie.com的域名全部称作是alidiedie.com的二级
4.HTTP部分的内容
5.TCP协议
TCP数据包需要设置端口,接收方(Google)的HTTP端口默认是80,发送方(本机)的端口是一个随机生成的1024-65535之间的整数,假定为51775。
TCP数据包的标头长度为20字节,加上嵌入HTTP的数据包,总长度变为4980字节。
6. IP协议
然后,TCP数据包再嵌入IP数据包。IP数据包需要设置双方的IP地址,这是已知的,发送方是192.168.1.100(本机),接收方是172.194.72.105(Google)。
IP数据包的标头长度为20字节,加上嵌入的TCP数据包,总长度变为5000字节。
7. 以太网协议
最后,IP数据包嵌入以太网数据包。以太网数据包需要设置双方的MAC地址,发送方为本机的网卡MAC地址,接收方为网关192.168.1.1的MAC地址(通过ARP协议得到)。
以太网数据包的数据部分,最大长度为1500字节,而现在的IP数据包长度为5000字节。因此,IP数据包必须分割成四个包。因为每个包都有自己的IP标头(20字节),所以四个包的IP数据包的长度分别为1500、1500、1500、560。
8 服务器端响应
经过多个网关的转发,Google的服务器172.194.72.105,收到了这四个以太网数据包。
根据IP标头的序号,Google将四个包拼起来,取出完整的TCP数据包,然后读出里面的”HTTP请求”,接着做出”HTTP响应”,再用TCP协议发回来。
本机收到HTTP响应以后,就可以将网页显示出来,完成一次网络通信。