HTTP协议

HTTP协议概述

1.什么是HTTP

HTTP 全称:Hyper Text Transfer Protocol
中⽂名:超⽂本传输协议
HTTP协议简单的说,将⽤户请求的⻚⾯从服务器传输到客户的浏览器,浏览器进⾏解析,解析以后变成
⼀个我们⼈类可以理解的⽅便观看的⻚⾯

2.什么是超⽂本

包含有超链接(Link)和各种多媒体元素标记(Markup)的⽂本。
超⽂本⽂件(Hypertext)就是指具有超链接功能的⽂件,它可以将⽂件中已经定义好的关键字
(Keyword),经过⿏标的点取(Click),便可以得到该关键字的相关解释,这种⽅法使⽤户使⽤起
来更感舒适

3.什么是URL

统⼀资源定位符
当我们访问:baidu.com
其实他访问的是:http://www.baidu.com:80/index.html
URL: http:// www.baidu.com :80 /index.html
 #协议 #域名 #端⼝ #⽂件及其路径
协议:协议还有很多,ftp、file、ssh、ws
域名:代表我们访问的主机,域名好记
端⼝:进⼊我们服务器的⻔
⽂件路径:服务器上的资源,实际路径有web服务决定
html⽂件->包含各种各样的元素(URL链接)->形成WebPage简称web⻚⾯
URL HTML HTTP 之间的关系
⼀个完整的HTML⻚⾯是由很多个URL地址资源组成的,⽽HTTP协议是来传输和解析HTML⻚⾯的

HTTP⼯作原理

1.⾸先,当你在浏览器中输⼊⼀个⽹址的时候(https://www.baidu.com/sie=utf8&f=8&rsv_bp=1&rsv_idx=1&tn=
baidu&wd=%E6%9B%BE%E8%80%81%E6%B9%BF&rsv_pq=c177c4df0026ba3e&rsv_t=e001VxO8FQ8I6s1o1i0km8
IYEX2%2F7PwwkwTB6FC%2FXU9Mmwz24Z4i%2BnYoP0I&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug2=
0&inputT=1729&rsv_sug4=1728)浏览器会帮你分析,你输⼊的这个URL
2.其次,浏览器会向DNS服务器请求解析,该URL中的域名www.baidu.com,解析出百度服务器所在的IP地址
3.DNS服务器,会将解析出来的IP地址110.111.112.113并返回给浏览器。
4.浏览器接收到DNS返回的IP地址,⽴即与该IP所在的服务器建⽴TCP连接(80端⼝)。
5.浏览器请求⽂档,也就是咱们常说的html⻚⾯,GET /index.html,并发出HTTP请求报⽂。
6.服务器给出响应,将请求的index.html⽂档返回给浏览器,也就是响应HTTP请求的报⽂。
7.TCP连接响应完之后,释放TCP连接。
8.最后就能显示出,你请求的这个⻚⾯了

浏览器会取数据后,⻚⾯的请求信息

1.基本信息(General)

Request URL: http://10.0.0.7/index.html #请求的URL
Request Method: GET #请求⽅式
Status Code: 304 Not Modified #状态码
Remote Address: 10.0.0.7:80 #远程主机IP和端⼝
Referrer Policy: no-referrer-when-downgrade #控制请求头信息

2.请求头部(Request Header)

#请求的域名
authority: www.baidu.com
#请求的⽅式
method: GET
#请求的地址和⽂件
path: /zenglaoshi/2039.html
#请求的协议
scheme: https
#请求的资源类型
accept:
text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng
,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9
#压缩
accept-encoding: gzip, deflate, br
#字符类型
accept-language: zh-CN,zh;q=0.9
#缓存的时间
cache-control: max-age=0
#登录信息
cookie: PHPSESSID=f9f51ca84a6078b85cb14e74ae9cf3ed
#升级
upgrade-insecure-requests: 1
#客户端信息
user-agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36
(KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36

3.响应头部(Response Header)

#阿⾥云的存储时间
ali-swift-global-savetime: 1582084570
#缓存控制
cache-control: no-store, no-cache, must-revalidate
#压缩
content-encoding: gzip
#⽂件类型和字符集
content-type: text/html; charset=UTF-8
#返回数据时间
date: Wed, 19 Feb 2020 03:56:10 GMT
#加密的id
eagleid: 7734021c15820845697086285e
#失效时间
expires: Thu, 19 Nov 1981 08:52:00 GMT
#软连接
link: <https://www.driverzeng.com/wp-json/>; rel="https://api.w.org/"
link: <https://www.driverzeng.com/?p=2039>; rel=shortlink
#没有缓存
pragma: no-cache
#使⽤web服务
server: Tengine
#状态码
status: 200
#限制参数,跨域使⽤
timing-allow-origin: *
#渲染
vary: Accept-Encoding
#缓存
via: cache7.l2cm9-5[576,200-0,M], cache41.l2cm9-5[577,0],
kunlun10.cn2040[763,200-0,M], kunlun8.cn2040[766,0]
----------------CDN服务器的参数-----------------------
#CDN缓存是否命中
x-cache: MISS TCP_MISS dirn:-2:-2
#缓存版本号
x-powered-by: PHP/7.1.21
#缓存时间
x-swift-cachetime: 0
#保存时间
x-swift-savetime: Sat, 03 Aug 2019 06:30:33 GMT

HTTP请求⽅法

在HTTP请求报⽂中的⽅法(Method),是对所请求对象所进⾏的操作,也就是⼀些命令。请求报⽂中的操作有:

*****HTTP响应⽅法

状态码(status-code)是响应报⽂状态⾏中包含的⼀个三位数字,指明特定的请求是否被满⾜

请求头部参数

HTTP协议原理总结

![](https://img2020.cnblogs.com/blog/2415131/202108/2415131-20210809172754420-1475000447.png)

1.⽤输⼊域名 - > 浏览器跳转 - > 浏览器缓存 - > Hosts⽂件 - > DNS解析(递归查询|迭代查询)
 客户端向服务端发起查询 - > 递归查询
 服务端向服务端发起查询 - > 迭代查询
2.由浏览器向服务器发起TCP连接(三次握⼿)
 客户端 -->请求包连接 -syn=1 seq=x 服务端
 服务端 -->响应客户端syn=1 ack=x+1 seq=y 客户端
 客户端 -->建⽴连接 ack=y+1 seq=x+1 服务端
3.客户端发起http请求:
 1)请求的⽅法是什么: GET获取
 2)请求的Host主机是: www.driverzeng.com
 3)请求的端端⼝是什么: 默认http是80 https是443
 4)请求的资源是什么: /index.html
 5)请求携带的参数是什么: 属性(请求类型、压缩、认证、浏览器信息、等等)
 6)请求最后的空⾏
4.服务端响应的内容是
 1)服务端响应使⽤WEB服务软件
 2)服务端响应请求⽂件类型
 3)服务端响应请求的⽂件是否进⾏压缩
 4)服务端响应请求的主机是否进⾏⻓连接
 5)服务端将数据放回给浏览器
5.客户端向服务端发起TCP断开(四次挥⼿)
 客户端 --> 断开请求 fin=1 seq=x --> 服务端
 服务端 --> 响应断开 fin=1 ack=x+1 seq=y --> 客户端
 服务端 --> 断开连接 fin=1 ack=x+1 seq=z --> 客户端
 客户端 --> 确认断开 fin=1 ack=x+1 seq=sj --> 服务端

HTTP协议

http1.0:短连接,⼀次TCP连接,仅能发起⼀次请求
http1.1:⻓连接,⼀次TCP连接,可以多次请求
http2.0:HTTPS会⽤到
http3.0

******⽤户访问集群架构流程

1.客户端发起http请求,请求会先抵达前端的防⽕墙
2.防⽕墙识别⽤户身份,正常的请求通过内部交换机通过tcp连接后端的负载均衡,传递⽤户的http请
求
3.负载接收到请求,会根据请求的内容进⾏下发任务,通过tcp连接后端的web,转发发⽤户的http请
求
4.web接收到⽤户的http请求后,会根据⽤户请求的内容进⾏解析,解析分为如下:
 静态请求:web直接返回给负载均衡->防⽕墙->⽤户
 动态请求:web向后端的动态程序建⽴TCP连接,将⽤户的动态http请求传递⾄动态程序->由动态
程序进⾏解析
5.动态程序在解析的过程中,如果碰到查询数据库请求,则优先与缓存建⽴tcp连接,并发起数据查询
操作。
6.如果缓存没有对应的数据,动态程序再次向数据库建⽴tcp连接,并发起查询操作。
7.最后数据由, 数据库->缓存->动态程序->web服务->负载均衡->防⽕墙->⽤户。

http名词,术语

假设公司有⼀座⼤厦,⼤厦有100⼈,每个⼈有⼀台电脑和⼀部⼿机,上⽹都是通过nat转换出⼝,每个⼈点击⽹站2次, 
请问对应的pv,uv,ip分别是多少?
pv 100⼈ * 2设备 * 2次 = 400 pv
uv 100⼈ * 2设备 = 200 uv
ip 100⼈ 2设备 2次 1 nat 1 ip
⾯试题:商家公司的IP、PV、UV是怎么统计的
1.nginx⽇志,分析筛选
2.第三⽅统计⼯具:腾讯移动分析、百度统计、piwik
⾯试题:你们上家公司PV是多少
⼩说⽹站 1分钟请求 5000 平均⽇pv = 720万 (屌丝,宅男)
教育⽹站 1分钟请求 10000 平均⽇pv = 1440万
在线⼈数,⽇活跃,⽉活跃

SOA松耦合架构

⾯向服务的架构(SOA)是⼀个组件模型,它将应⽤程序的不同功能单元(称为服务)进⾏拆分,
并通过这些服务之间定义良好的接⼝和契约联系起来。接⼝是采⽤中⽴的⽅式进⾏定义的,它应该独
⽴于实现服务的硬件平台、操作系统和编程语⾔。这使得构建在各种各样的系统中的服务可以以⼀种统⼀和通
⽤的⽅式进⾏交互。
#⼀个电商公司,他的⽹站⻚⾯功能会有很多
 注册
 登录
 ⾸⻚
 详情⻚
 购物⻋
 价格标签
 留⾔
 客服
 ⽀付中⼼
 物流
 仓储信息
 订单相信
 图⽚

posted @ 2021-08-09 15:36  小丶凡  阅读(170)  评论(0编辑  收藏  举报
1