互联网5层协议 -- 重学计算机网络

该学好的课划水过去了,后来都是要还的。

 

还是先参考着阮一峰的文章先略记吧,需要的时候再补充《计算机网络》书上的内容

http://www.ruanyifeng.com/blog/2012/05/internet_protocol_suite_part_i.html

 

大家都遵守的规则就叫协议,互联网的核心是一系列协议,总称为"互联网协议"(Internet Protocol Suite)。

它们对电脑如何连接和组网,做出了详尽的规定。理解了这些协议,就理解了互联网的原理。

 

# 五层模型

宽带通信网课程的老师说过,重要的不是3层5层7层,重要的是分层的思想。把功能拆解,各司其职,不只是对于互联网协议有价值。

七层其实是更完善的,但设计出来时,五层已经统治地球了,科研拗不过市场。哈哈。

于是从用户到底层硬件就如下:(中文译名有所区别,英文都一样)PS:layer 和 level 区别?

  • 应用层(Application Layer)
    • 规定应用程序的数据格式; 收到"传输层"的数据,进行解读。
    • 举例来说,TCP协议可以为各种各样的程序传递数据,比如Email、WWW、FTP等等。那么,必须有不同协议规定电子邮件、网页、FTP数据的格式,这些应用程序协议就构成了"应用层"。
    • 直接面对用户。数据就放在TCP数据包的"数据"部分
  • 传输层(Transport Layer)
    • 找到主机后找端口(PORT),数据包和具体程序匹配:0-65535,16个二进制
    • 0-1023被系统占用。应用程序随机选一个
    • 主机+端口:套接字(Socket)
    • UDP 规定了数据包格式,Head+Data 放入 IP 的 Data. Head定义了发出端口和接收端口,总长不超过65535字节
    • TCP 近似有确认机制的 UDP,实现复杂。也内嵌在IP数据包的Data, 数据包没有长度限制,但是为了保证网络的效率,通常不会超过IP数据包,以确保单个TCP数据包不必再分割。
  • 网络层(Network Layer)
    • 用 MAC 地址发送数据有缺陷:广播效率低,只能在子网
    • 于是:子网内 广播,网间 路由(如何向不同的子网络分发数据包)
    • 网络地址——确定计算机所处子网络
    • 规定网络地址的协议,叫做IP协议。它所定义的地址,就被称为IP地址。目前,广泛采用的是IP协议第四版,简称IPv4。这个版本规定,网络地址由32个二进制位组成。

    • IP 地址(网络+主机) 和 子网掩码 位与 得到子网地址
    • Head + Data 一起放进(封装进)链路层的 Data 里,Head 20-50字节,总长最大65535字节,于是一个 IP 包可能要拆成多个链路层的以太网数据包
  • 链路层(Link Layer)
    • 在各家争霸中,以太网(Ethernet)协议胜出,包括数据分组、设备地址、发送方式
    • 数据分组:如:多少个0、1算一组?各个信号位什么意思?——一组电信号构成一帧(Frame),包括 Head 和 Data:Head 18字节,包含数据包说明项(收发方,数据类型等);Data46-1600字节
    • 地址:所有连入网络的设备都有网卡,网卡出厂时都有MAC 地址,即48位二机制地址(12个十六进制数字,厂商+网卡号)
    • 怎么知道 MAC?
      • 不同子网的计算机不知道对方 MAC 地址,只能发给网关(gateway);
      • 同一子网内用,ARP:广播含目标 IP 的数据包,MAC 位置填FF:FF:FF:FF:FF:FF代表广播,IP 匹配上的计算机会回复自己的 MAC,否则丢弃。
    • 数据发送:广播(broadcasting),向本网络内所有计算机发送
  • 物理层(Physical Layer)
    •   用物理手段(光缆、电缆、双绞线、无线电)把计算机连接起来,规定电气特性,负责传送0、1电信号(高低电平)

 # 疑问:为什么要用 MAC 地址,直接 IP 不都能找到主机了吗?什么时候是 UDP 什么时候是 TCP

下面从用户的角度来看待:

  • 静态IP地址
    • 本机 IP 地址
    • 子网掩码
    • 网关的IP地址
    • DNS的IP地址
  • 动态 IP 地址
    • DHCP协议自动分配 IP 地址:每一个子网络中,有一台计算机负责管理本网络的所有IP地址,即"DHCP服务器"。新的计算机加入网络,必须向"DHCP服务器"发送一个"DHCP请求"数据包,申请IP地址和相关的网络参数。
    • 如果两台计算机在同一个子网络,必须知道对方的MAC地址和IP地址,才能发送数据包。但是,新加入的计算机不知道这两个地址,怎么发送数据包呢?
      •  DHCP 是应用层协议,在 UDP 协议之上,所以 "DHCP请求"数据包是这样的

 

      • "以太网标头",设置发出方(本机)的MAC地址和接收方(DHCP服务器)的MAC地址。前者就是本机网卡的MAC地址,后者填入FF-FF-FF-FF-FF-FF。
      • 后面的"IP标头",设置发出方的IP地址和接收方的IP地址。这时,对于这两者,本机都不知道。于是,发出方的IP地址就设为0.0.0.0,接收方的IP地址设为255.255.255.255。
      • 最后的"UDP标头",设置发出方的端口和接收方的端口。这一部分是DHCP协议规定好的,发出方是68端口,接收方是67端口。
      • DHCP服务器读出这个包的数据内容,分配好IP地址,发送回去一个"DHCP响应"数据包。这个响应包的结构也是类似的,以太网标头的MAC地址是双方的网卡地址,IP标头的IP地址是DHCP服务器的IP地址(发出方)和255.255.255.255(接收方),UDP标头的端口是67(发出方)和68(接收方),分配给请求端的IP地址和本网络的具体参数则包含在Data部分。

一个实例:访问网页

  • 用户设置好了自己的网络参数:

  * 本机的IP地址:192.168.1.100
  * 子网掩码:255.255.255.0
  * 网关的IP地址:192.168.1.1
  * DNS的IP地址:8.8.8.8

  • 打开浏览器,输入了网址:www.google.com -->浏览器要向Google发送一个网页请求的数据包。
  • DNS协议可以帮助我们,将这个网址转换成IP地址。已知DNS服务器为8.8.8.8,于是我们向这个地址发送一个DNS数据包(53端口)。然后,DNS服务器做出响应,回复Google的IP地址是172.194.72.105为什么是 UDP

  • 接下来要判断,这个IP地址是不是在同一个子网络
    • 已知子网掩码是255.255.255.0(DNS也回复了谷歌的子网掩码?),对自己的IP地址Google的IP地址做AND运算,两个结果不相等,所以google与本机不在同一个子网络。
    • 因此,我们要向Google发送数据包,必须通过网关192.168.1.1转发,也就是说,接收方的MAC地址将是网关的MAC地址。
  •  应用层协议,浏览网页用的是HTTP协议,它的整个数据包构造是这样的:为什么是 TCP

HTTP部分的内容,类似于下面这样:

  GET / HTTP/1.1
  Host: www.google.com
  Connection: keep-alive
  User-Agent: Mozilla/5.0 (Windows NT 6.1) ......
  Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
  Accept-Encoding: gzip,deflate,sdch
  Accept-Language: zh-CN,zh;q=0.8
  Accept-Charset: GBK,utf-8;q=0.7,*;q=0.3
  Cookie: ... ...

我们假定这个部分的长度为4960字节,它会被嵌在TCP数据包之中。

  • TCP协议
    • TCP数据包需要设置端口,接收方(Google)的HTTP端口默认是80,发送方(本机)的端口是一个随机生成的1024-65535之间的整数,假定为51775
    • TCP数据包的标头长度为20字节,加上嵌入HTTP的数据包,总长度变为4980字节。
  • IP协议
    • 然后,TCP数据包再嵌入IP数据包。IP数据包需要设置双方的IP地址,这是已知的,发送方是192.168.1.100(本机),接收方是172.194.72.105(Google)。IP数据包的标头长度为20字节,加上嵌入的TCP数据包,总长度变为5000字节。
  • 以太网协议
    • 最后,IP数据包嵌入以太网数据包。以太网数据包需要设置双方的MAC地址,发送方为本机的网卡MAC地址,接收方为网关192.168.1.1的MAC地址(通过ARP协议得到)。
    • 以太网数据包的数据部分,最大长度为1500字节,而现在的IP数据包长度为5000字节。因此,IP数据包必须分割成四个包。因为每个包都有自己的IP标头(20字节),所以四个包的IP数据包的长度分别为1500、1500、1500、560。

  • 服务器端响应
    • 经过多个网关的转发,Google的服务器172.194.72.105,收到了这四个以太网数据包。
    • 根据IP标头的序号,Google将四个包拼起来,取出完整的TCP数据包,然后读出里面的"HTTP请求",接着做出"HTTP响应",再用TCP协议发回来。
    • 本机收到HTTP响应以后,就可以将网页显示出来,完成一次网络通信。

 

 

posted @ 2016-07-15 17:02  Pudding_AI  阅读(282)  评论(0编辑  收藏  举报