学HTTP协议所要知道的基础知识(微总结)
1、网络本质
进行资源共享和信息传输。
2、基于网络的应用程序的本质
就是获取数据和传输数据给用户使用。
3、TCP/IP协议栈工作流程
实体层是不属于TCP/IP协议栈的一层。也就是说TCP/IP协议栈共计四层。
首先得接入网络,局域网或者广域网,在计算机接入网络的时候,也就是插入网线的时候本地路由器中的
路由表会更新数据,通过一定淘汰机制算法删除很久没有使用过的计算机ip以及mac地址,并对新加入组的计算
机新分配ip,在分配ip的过程中,路由表会通过ARP协议(地址解析协议)得到新接入计算机的mac地址,并存入
mac地址以及分配的ip地址。
首先A用户使用应用程序产生数据,并通过应用层约定的规则(即应用层协议)发送数据,数据进行第一次封
装形成head和data。再通过传输层确定目标计算机所需要接受数据的端口再次进行编码第二次封装,利用传输层
约定的规则(即传输层协议,tcp/udp)发送数据,数据到达网络层,网络层通过ip协议确认要发送数据的目标ip,
然后通过数据链路层的mac地址,数据链路层把数据通过以太网协议第三次封装成帧,帧也分head(标头,固定长
度18字节)和data(数据,最短46字节,最长1500字节),超出则分成多个帧进行发送。再通过实体层进行第四次
封装,把数据利用实体层协议封装成1或者0高低电位,这里可能会使用差分曼彻斯特等编码方式,数据这时候通过
网线或者电磁波到达路由或者交换机,路由首先查看目标ip是否在本组局域网内,通过目标ip地址以及发送方ip地
址对本地子网掩码进行与(and)运算,如果运算结果相等则说明目标主机在此局域网之内,则直接通过路由表确定
ip以及mac信息发送数据。如果不相等则路由器继续向上层发送这次发送的数据,直到某个结点有属于目标ip的信息
时,进行接收,并再次通过实体层->数据链路层->网络层->传输层->应用层的方式进行四次拆包,找到ip->确认mac
地址->确认端口信息,接收数据到B用户使用的应用程序上,再由应用程序展现到B用户面前。
4、网络五层
1)应用层:
应用层决定了向用户提供应用服务时通信的活动,HTTP 协议也处于该层。
2)传输层:
传输层对上层应用层提供处于网络连接中的两台计算机之间端口到端口的数据传输。在传输层有两个性质不同的协议: TCP 和 UDP 。
3)网络层:
网络层用来处理在网络上流动的数据包。数据包是网络传输的最小数据单位。该层规定了通过怎样的路径(ip地址到ip地址)到达对方计算机,
并把数据包传送给对方。
与对方计算机之间通过多台计算机或网络设备进行传输时,网络层所起的作用就是在众多的选项内选择一条传输路线。
4)链路层:
用来处理连接网络的硬件部分。包括控制操作系统、硬件的设备驱动、网卡及光纤等物理可见部分(还包括连接器等一切传输媒介)。
硬件上的范畴均在链路层的作用范围之内。
5)实体层:
负责通过物理手段将电脑连接起来,并传输0和1的电信号。
5、Html,即超文本
超级文本,把线性的文本变成非线性的文本,带跳转。
6、HTTP协议
HTTP协议是在 TCP/IP 协议族的基础上运作的,是TCP/IP的一个子集。
是在应用层上对服务器,客户端进行数据传输方式,传输格式约束和规定的一个协议,具体格式和流程
在下面说明。
7、服务器、服务、服务器程序
服务器可以理解成一台比较厉害的主机,服务器对每个客户端提供服务,针对客户端请求的服务,
由服务器程序调用对应的服务,给客户端提供服务。
8、浏览器———>服务器 请求 响应
客户端发起对服务器的请求,发送请求报文,服务器接收到请求报文,如果发送不带Cookie的报文(例如初次登录)
,服务器会设置Cookie并记录,并回复响应报文,并对比请求头中的缓存数据,如果记录的最后一次修改时间等于服务
器最后一次修改时间或者资源戳和服务器一致,则不返回新页面,客户端继续使用原来的界面,否则返回新页面。
9、url
url格式:schema://host[:port#]/path/../[?query-string][#anchor]
i. schema:使用的协议,http、https。 https就是安全的http协议
ii. host:表示请求服务器的域名或者ip地址
iii. port:端口号,默认是80
iv. path:请求资源的路径
v. query-string:发送给服务器的数据
vi. anchor:锚,跟服务器无关,只跟客户端有关
url举例:http://www.mywebsit.com/sj/test/test.html?name=zhangsan&age=18
schema:http
host:www.mywebsit.com
port:80
path:sj/test/test.html
query-string:name=zhangsan&age=18
10、报文相关信息补充:
请求报文:
请求报文有4部分:
1、Request line(请求行)
结构:Method/path-to-resource HTTP/Version-number
Method:请求方法:Get、Post
Get 获取服务器的数据
Post 提交数据到服务器
Path-to-resource:请求资源的路径url
Version-number:版本号 一般HTTP/1.1
2、Request header(请求头)
Accept:浏览器接收的数据类型
Accept-Encoding:浏览器能够接收数据的编码格式
Accept-Language:浏览器支持的语言
Accept-Charset:浏览器能够接收的字符集类型
User_Agent:用户代理,告诉服务器客户端的浏览器信息和操作系统信息
Connection:keep alive(长连接和短连接)
Host:主机地址
Cookie:用户识别(保存用户名)
3、空行
4、Request body(请求体)
响应报文:
响应报文也分为四部分:
1、Response line(响应行)
结构:HTTP/Version-number status-code message
HTTP/version number :版本号 一般HTTP/1.1
Status code :状态码
a)状态码作用:服务器用来告诉浏览器是否产生了浏览器预期的Response
b)状态码类别:1XX 2XX 3XX 4XX 5XX
i. 1XX:提示信息,表示服务器已经接收到浏览器的请求,继续处理
ii. 2XX:处理成功,表示浏览器的请求已经成功被接收、并正确处理
iii.3XX:重定向,表示需要进行更进一步的处理
iv. 4XX客户端请求错误,表示客户端请求出现错误
v. 5XX服务器端错误,服务器未能正确处理客户端请求
常见状态码解释:
i. 200 OK :表示客户端请求被成功接收,并将响应数据发送给客户端
ii. 302 Found :重定向,新的URL会在Response中返回,浏览器将会自动向新的URL发送请求。
iii. 304 Not Modified :表示信息已经被缓存了,还可以继续使用
iv. 403 Forbidden :服务器接收到客户端请求,但拒绝为客户端提供服务
v. 404 Not Found :表示客户端请求的资源不存在(url输错了)
vi. 500 Internet Server Error :服务器发生了不可预期的错误
Message:状态码对应的状态信息
2、Response header(响应头)
Date:消息生成时间
Content-type:响应数据的类型
Transfer-encoding:分块传输
Last-Modified: Fri, 13 Apr 2018 06:43:31 GMT :服务器记录的文件最后一次修改的时间
Content-type:响应报文的body的内容类型
Etag:资源戳,与请求报文的if-none_match配合使用
Set-Cookie:将Cookie数据发送到浏览器,并要求浏览器进行记录
Content-Encoding:服务器响应给浏览器的文件的压缩方式
Content-Language:服务器告诉浏览器响应的语言
Server:服务器告诉浏览器当前服务器的信息
Location:重定向的url
3、空行
4、Request body(响应体)
用户看到的内容,一般使用静态或者动态的网页代码