HTTP (超文本传输协议)
## 一、HTTP协议
1.什么是http
HTTP 全称:Hyper Text Transfer Protocol
中文名:超文本传输协议
是一种按照URL指示,将超文本文档从一台主机(Web服务器)传输到另一台主机(浏览器)的应用层协议,以实现超链接的功能。
http协议就是将用户的请求发送到服务器,再将服务器返回的内容传输给浏览器,浏览器进行解析,解析成便于人类读取的页面
超文本
包含有超链接(Link)和各种多媒体元素标记(Markup)的文本。这些超文本文件彼此链接,形成网状(Web),因此又被称为网页(Web Page)。
这些链接使用URL表示。最常见的超文本格式是超文本标记语言HTML。
URL
URL即统一资源定位符(Uniform Resource Locator),用来唯一地标识万维网中的某一个文档。
URL由协议、主机和端口(默认为80)以及文件名三部分构成:
#当我们访问 jd.com
#实际上我们访问的是 https://www.jd.com/
#URL: http://www.jd.com:80/2039.html
#协议: http:// https:// ftp:// ssh:// file://
#域名: www.jd.com
#端口: :80 web服务的端口
#请求的文件: /2039.html / 指的不是根目录,而是站点目录,我们可以自己指定
http 和 url 和 html 的关系
一个完整的html是由很多个URL组成的,而http是将html的内容进行传输和解析的
HTTP协议原理
1.文字描述(正常)
1.首先,当你在浏览器中输入一个网址的时候(https://www.jd.com/?cu=true&utm_source=haosou-search&utm_medium=cpc&utm_campaign=t_262767352_haosousearch&utm_term=5512151540_0_fb5374d2cc4f4afc9e39d999fbd06b1d)浏览器会帮你分析,你输入的这个URL
2.其次,浏览器会向DNS服务器请求解析,该URL中的域名www.jd.com,解析出百度服务器所在的IP地址
3.DNS服务器,会将解析出来的IP地址10.10.0.3并返回给浏览器。
4.浏览器接收到DNS返回的IP地址,立即与该IP所在的服务器建立TCP连接(80端口)。
5.浏览器请求文档,也就是咱们常说的html页面,GET /index.html,并发出HTTP请求报文。
6.服务器给出响应,将请求的index.html文档返回给浏览器,也就是响应HTTP请求的报文。
7.TCP连接响应完之后,释放TCP连接。
8.最后就能显示出,你请求的这个页面了二、HTTP协议原理
2.文字描述(滑稽版)
单身狗明哥哥:浏览器饰
中介人员:DNS饰
萍霉霉照片:URL饰
萍霉霉:服务器饰
1.首先作为单身狗的浏览器,在拿到一个URL(萍霉霉照片)之后,先分析(性感)...身材,脸蛋emmmmm...不可描述。
2.然后找到DNS(中介人员),哥,你把这个小姐姐的,电话,微信,等发给我呗
3.DNS(中介人员),开始找,这个萍霉霉的信息...找到手机号13245113返回给这个姓明哥哥的单身狗(浏览器)
4.明哥哥拿到手机号之后,十分开心,于是就开始打电话(建立TCP连接)给萍霉霉。
5.明哥哥,打电话,给小姐姐萍霉霉,发出邀约请求(HTTP请求报文,GET /index.html)我们见一面吧,电影院,公园,酒店...都可以。
6.萍霉霉,回应明哥哥的请求,(HTTP响应报文)现在是大夏天的公园热,电影院又黑,我怕黑...那就酒店见吧,你开好房间等我。
7.挂掉电话,(释放TCP连接)
8.明哥哥和萍霉霉,在...,明哥哥掏出.........自己的手机,你看我的手机是夜光的(显示html页面)...再见单身
访问网站分析
## 请求过程中是以报文的形式 -- 报文的形式
1.GET那一部分内容被称为:请求头信息
2.GET和HTTP之间有一个空行被称为:请求空行
3.HTTP中的信息被称为:回应信息
4.HTTP与faa之间也有个空行被称为:响应空行
5.faa部分被称为:主体
访问网站分析 -- 细部分析 (F12键)-- > 查找原因
1.基本信息 General
#请求 URL:
http://10.10.0.8/noindex/css/bootstrap.min.css
#请求方法:
GET
#状态代码:
200 OK (来自内存缓存)
#远程地址:
10.10.0.8:80
#引用站点策略:
strict-origin-when-cross-origin
2.响应头部 Response Headers
#此字段的值表示可用于定义范围的单位。
Accept-Ranges: bytes
#响应过程保持长连接
Connection: Keep-Alive、
#响应数据的长度
Content-Length: 19341
#响应数据的类型
Content-Type: text/css
#响应日期
Date: Mon, 29 Mar 2021 02:58:16 GMT
#缓存文件的唯一标识符,决定走不走缓存
ETag: "4b8d-4fc0a3f32a9c0"
#长连接保持的设置
Keep-Alive: timeout=5, max=99
#记录文件最后的修改时间,决定走不走缓存
Last-Modified: Tue, 17 Jun 2014 16:00:47 GMT
#服务器上的服务
Server: Apache/2.4.6 (CentOS) PHP/5.4.16
3.请求头部 Request Headers
#请求的文件类型
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9
#请求过程支持的操作
Accept-Encoding: gzip, deflate
#请求过程支持的语言
Accept-Language: zh-CN,zh;q=0.9
#缓存控制,没有缓存
Cache-Control: no-cache
#请求过程保持长连接
Connection: keep-alive
#请求的主机地址
Host: 10.0.0.8
#缓存
Pragma: no-cache
#支持HTTPS请求加密
Upgrade-Insecure-Requests: 1
#客户端信息
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36
#上一个访问的页面
Referer: https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=1&rsv_idx=1&tn=21002492_6_hao_pg&wd=referrer%20policy%E7%9A%84%E4%BD%9C%E7%94%A8&fenlei=256&rsv_pq=f6327f9600103da8&rsv_t=0dd6yhBdiQtZKV0vyvegADd9t%2Fl1BgoNxl%2Fh83mkRag0wa9eAOov9qXH9pbh8hpfXBO%2BAiUEhmA&rqlang=cn&rsv_enter=1&rsv_dl=ts_0&rsv_sug3=2&rsv_sug1=2&rsv_sug7=101&rsv_sug2=1&rsv_btype=i&prefixsug=Referrer%2520Policy&rsp=0&inputT=1290&rsv_sug4=1344https://www.jd.com/?cu=true&utm_source=haosou-search&utm_medium=cpc&utm_campaign=t_262767352_haosousearch&utm_term=5512151540_0_fb5374d2cc4f4afc9e39d999fbd06b1d
HTTP请求方法
在HTTP请求报文中的方法(Method),是对所请求对象所进行的操作,也就是一些命令.
方法 (Method) 含义
#GET 请求读取一个Web页面
POST 上传一个文件 (如Web页面)
DELETE 删除Web页面
CONNECT 用于代理服务器
HEAD 请求读取一个Web页面的头部
#PUT 请求修改一个Web页面 == >相当于ctrl +s
TRACE 用于测试,要求服务器送回收到的请求
#OPTION 查询特定选项
HTTP协议版本
HTTP/1.0 #短连接
HTTP/1.1 #长连接
HTTP/2.0 #长连接
HTTP/3
HTTP响应方法
状态码(status-code)是响应报文状态行中包含的一个3位数字,指明特定的请求是否被满足,如果没有满足,原因是什么。
状态码分为以下五类:
状态码 含义
200 成功
301 永久重定向(跳转)
302 临时重定向(跳转)
304 本地缓存
307 内部重定向(跳转)
400 客户端错误
401 认证失败
403 找不到主页,权限不足
404 找不到页面
500 内部错误
502 找不到后端主机
503 服务器过载
504 后端主机超时
请求头部信息
HTTP请求流程总结
1.HTTP访问流程图
## 2.原理
1.用输入域名 - > 浏览器跳转 - > 浏览器缓存 - > Hosts文件 - > DNS解析(递归查询|迭代查询)
客户端向服务端发起查询 - > 递归查询
服务端向服务端发起查询 - > 迭代查询
2.由浏览器向服务器发起TCP连接(三次握手)
客户端 -->请求包连接 syn=1 seq=x 服务端
服务端 -->响应客户端 syn=1 ack=x+1 seq=y ACK=1 客户端
客户端 -->建立连接 ack=y+1 seq=x+1 ACK=1 服务端
3.客户端发起http请求:
1)请求的方法是什么: GET获取
2)请求的Host主机是: http://www.jd.com:80/2039.html
3)请求的资源是什么: /2039.html
4)请求的端端口是什么: 默认http是80 https是443
5)请求携带的参数是什么: 属性(请求类型、压缩、认证、浏览器信息、等等)
6)请求最后的空行
4.服务端响应的内容是
1)服务端响应使用WEB服务软件
2)服务端响应请求文件类型
3)服务端响应请求的文件是否进行压缩
4)服务端响应请求的主机是否进行长连接
5.客户端向服务端发起TCP断开(四次挥手)
客户端 --> 断开请求 FIN=1 seq=u --> 服务端
服务端 --> 响应断开 FIN=1 ack=u+1 seq=m --> 客户端
服务端 --> 断开连接 FIN=1 ACK=1 ack=u+1 seq=w-->客户端
客户端 --> 确认断开 ACK=1 ack=w+1 seq=u+1 --> 服务端
3.用户访问集群架构的流程
1.客户端发起http请求,请求会先抵达前端的防火墙
2.防火墙识别用户身份,正常的请求通过内部交换机通过tcp连接后端的负载均衡,传递用户的http请求
3.负载接收到请求,会根据请求的内容进行下发任务,通过tcp连接后端的web,转发发用户的http请求
4.web接收到用户的http请求后,会根据用户请求的内容进行解析,解析分为如下:
静态请求:web直接返回给负载均衡->防火墙->用户
动态请求:web向后端的动态程序建立TCP连接,将用户的动态http请求传递至动态程序->由动态程序进行解析
5.动态程序在解析的过程中,如果碰到查询数据库请求,则优先与缓存建立tcp连接,并发起数据查询操作。
6.如果缓存没有对应的数据,动态程序再次向数据库建立tcp连接,并发起查询操作。
7.最后数据由, 数据库->动态程序->缓存->web服务->负载均衡->防火墙->用户。
http相关术语
## 1.pv,uv,ip
假设公司有一座大厦,大厦有100人,每个人有一台电脑和一部手机,上网都是通过nat转换出口,每个人点击网站2次, 请问对应的pv,uv,ip分别是多少?
PV : 页面独立浏览量
UV : 独立设备
IP : 独立IP
那么上面的题:
PV: 100*2*2 = 400
UV: 100*2 = 200
IP: 1
日PV千万量级并不大
SOA松耦合架构 -->把一个耦合分成多个松耦合
面向服务的架构(SOA)是一个组件模型,它将应用程序的不同功能单元(称为服务)进行拆分,并通过这些服务之间定义良好的接口和契约联系起来。接口是采用中立的方式进行定义的,它应该独立于实现服务的硬件平台、操作系统和编程语言。这使得构建在各种各样的系统中的服务可以以一种统一和通用的方式进行交互。
#一个电商公司,他的网站页面功能会有很多
注册
登录
首页
详情页
购物车
价格标签
留言
客服
支付中心
物流
仓储信息
订单相信
图片