客户/服务端及互联网协议
1. 客户端/服务端架构
1.1 C/S与B/S
client<___基于网络通信————》server 用户 服务端
browser<----基于网络通信————》server 浏览器 服务端
1.2 数据发送接收流程
client发送请求给操作系统,操作系统控制硬件(网卡),网卡通过网线将用户请求数据发送到服务端硬件,服务端硬件将数据交给操作系统,操作系统再把数据传给服务端软件;服务端对数据进行处理后,调用操作系统,让操作系统调网卡,将要返回的数据通过网线再传回客户端。
1.3 server端要满足的条件
- 稳定的运行(网络、硬件、操作系统、服务端应用软件),对外一直提供服务
- 服务端必须绑定一个固定的地址
2. 互联网通信协议
2.1 定义
- 底层的物理连接介质,为通信铺好了道路;
- 本质上就是一系统的网络协议,互联网通信协议功能:定义计算机如何接入internet,以及接入internet的计算机通信标准
2.2 自定义协议
任何一种通信协议都必须包含两部分:
1、报头head:必须是固定长度 18个字节
2、数据data:
2.3 以太网协议(ethernt)
一组电信号构成一个数据包,叫做‘帧’
每一数据帧分成:报头head和数据data两部分
head data
head包含:(固定18个字节)
发送者/源地址,6个字节
接收者/目标地址,6个字节
数据类型,6个字节
data包含:(最短46字节,最长1500字节)
数据包的具体内容
head长度+data长度=最短64字节,最长1518字节,超过最大限制就分片发送
2.4 IP协议
- 定义:
规定网络地址的协议叫ip协议,它定义的地址称之为ip地址,广泛采用的v4版本即ipv4,它规定网络地址由32位2进制表示
范围0.0.0.0-255.255.255.255
一个ip地址通常写成四段十进制数,例:172.16.10.1
- IP地址组成
网络部分:标识子网
主机部分:标识主机
注意:单纯的ip地址段只是标识了ip地址的种类,从网络部分或主机部分都无法辨识一个ip所处的子网
- 子网掩码
(1)定义:
子网掩码,就是表示子网络特征的一个参数。它在形式上等同于IP地址,
也是一个32位二进制数字,它的网络部分全部为1,主机部分全部
为0。比如,IP地址172.16.10.1,如果已知网络部分是前24位,
主机部分是后8位,那么子网络掩码就是11111111.11111111.11111111.00000000,
写成十进制就是255.255.255.0
(2)判断任意两个IP是否在子网络
将两个IP地址与子网掩码分别进行AND运算(两个数位都为1,运算结果为1,否则为0),
然后比较结果是否相同,如果是的话,就表明它们在同一个子网络中
,否则就不是。
- ip数据包
ip数据包也分为head和data部分,无须为ip包定义单独的栏位,直接放入以太网包的data部分
head:长度为20到60字节
data:最长为65,515字节。
而以太网数据包的”数据”部分,最长只有1500字节。因此,如果IP数据包超过了1500字节,它就需要分割成几个以太网数据包,分开发送了
2.5 ARP协议
- 功能:广播的方式发送数据包,获取目标主机的mac地址
- 工作方式:
(1)首先通过ip地址和子网掩码区分出自己所处的子网
(2)分析主机的IP与要访问的IP是否在同一网络,如果不是同一网络,目标IP通过arp获取的是网关的mac
(3)这个包会以广播的方式在发送端所处的自网内传输,所有主机接收后拆开包,发现目标ip为自己的,就响应,返回自己的mac
2.6 标识地址方式(mac,ip,port)
2.6.1 mac 网卡地址
- head中包含的源和目标地址由来:ethernet规定接入internet的设备都必须具备网卡,发送端和接收端的地址便是指网卡的地址,即mac地址
- mac地址:每块网卡出厂时都被烧制上一个世界唯一的mac地址,长度为48位2进制,通常由12位16进制数表示(前六位是厂商编号,后六位是流水线号)
2.6.2 标识方式
- ip+mac就能标识全世界范围内独一无二的一台计算机
- ip+mac+port就能标识全世界范围内独一无二的一个基于网络通信的应用软件
- url地址:标识全世界范围内独一无二的一个资源
2.7 TCP/IP五层模型简介
2.7.1 物理层
- 由来:各计算机之间要实现连接,必须要组网,相关介质(光缆、电缆,无线电波等)
- 功能:主要是基于电器特性发送高低电压(电信号),高电压对应数字1,低电压对应数字0
2.7.2 数据链路层
- 由来:单纯的电信号0和1没有任何意义,必须规定电信号多少位一组,每组什么意思
- 功能:定义了电信号的分组方式(以太网协议,Mac地址,广播)
有了mac地址,同一网络内的两台主机就可以通信了(一台主机通过arp(地址解析协议)获取另外一台主机的mac地址)
ethernet采用最原始的方式,广播的方式进行通信,即计算机通信基本靠吼
2.7.3 网络层
- 由来:如果所有的通信都采用以太网的广播方式,那么一台机器发送的包全世界都会收到,局限性太大
- 解决方案:区分哪些计算机属于同一广播域,哪些不是,如果是就采用广播的方式发送,如果不是,就采用路由的方式(向不同广播域/子网分发数据包),mac地址是无法区分的,它只跟厂商有关
网络层功能:引入一套新的地址用来区分不同的广播域/子网,这套地址即网络地址 - 所需支持:IP协议,ARP地址解析协议,子网掩码
2.7.4 传输层
- 由来:网络层的ip帮我们区分子网,以太网层的mac帮我们找到主机,然后大家使用的都是应用程序,你的电脑上可能同时开启qq,暴风影音,等多个应用程序,通过ip和mac找到了一台特定的主机,要想标识主机上的应用程序,必须要通过端口(应用程序与网卡关联的编号)
- 功能:建立端口间的通信(端口范围0-65535,0-1023为系统占用端口)
- TCP 协议
可靠传输,TCP数据包没有长度限制,理论上可以无限长,但是为了保证网络的效率,通常TCP数据包的长度不会超过IP数据包的长度,
以确保单个TCP数据包不必再分割。
- UDP 协议
不可靠传输,”报头”部分一共只有8个字节,总长度不超过65,535字节,正好放进一个IP数据包。
以太网头 ip头 udp头 数据
2.7.5 应用层
- 由来:用户使用的都是应用程序,均工作于应用层,互联网是开发的,大家都可以开发自己的应用程序,数据多种多样,必须规定好数据的组织形式
- 功能:规定应用程序的数据格式。
3. TCP协议
3.1 建连接(三次握手)
- 交互流程:
(1)刚开始客户端处于发送请求的状态(SYN_SENT),服务端处于监听请求的状态(LISTEN),客户端发送请求包SYN=1和序列号seq= x;
(2)服务端处于已收到请求的状态(SYN_RCVD)(如果经常出现这种状态可能输虚假请求),返回确认包和序列号(ACK=x+1),
并发送请求包SYN 和序列号seq=y,此时客户端是链接成功的状态(ESTABLISHED);
(3)客户端发送确认包和序列号(ACK=Y+1),服务端也是链接的状态
3.2 断连接(四次挥手)
(1)服务端要处理众多客户端的请求,在传完数据后服务端先发起断开连接;刚开始客户端处于等待关闭连接的状态(CLOSE_WAIT),服务端处于主动断开连接的状态(FIN_WAIT_1),并发起断开连接的请求和序列号;
(2)客户端返回确认包(ACK=x+3),服务端处于被动断开连接的状态(FIN_WAIT_2);
(3)客户端发送断开连接的请求包和序列号,客户端处于断开连接的状态,服务端处于处理客户端请求的状态(TIME_WAIT);
(4)服务端处理完毕后,返回确认包(ACK=y+2).
注:如果服务端经常出现(TIME_WAIT),表示有许多人在发送请求
3.3 TCP与UDP特征
- TCP:(1)可以接收任何请求,是个漏洞;
(2)可靠协议,服务端系统会在确认客户端收到数据后,再把自己的缓存数据清除;
(3)传输效率低; - UDP:(1)根据IP和端口传输数据,不用链接;
(2)不可靠协议,发出数据都不考虑接收对象是否收到,直接清除自己缓存的数据
(3)传输效率高;