web基础之HTTP协议
web基础之HTTP协议
HTTP协议介绍
什么是HTTP
HTTP
全称:Hyper Text Transfer Protocol
中文名:超文本传输协议
什么是超文本传输协议
包含有超链接(Link)和各种多媒体元素标记(Markup)的文本。这些超文本文件彼此链接,形成网状(Web),因此又被称为网页(Web Page)。这些链接使用URL表示。最常见的超文本格式是超文本标记语言HTM
html文件->包含各种各样的元素(URL链接)->形成WebPage简称web页面
什么是URL
统一资源定位符,用来唯一标识万维网中的某一个文档
URL
由协议、主机和端口(默认为80)以及文件名三部分构成
URI
在URL
中的文件部分,被称为URI
http:// www.driverzeng.com: 80 /news/index.html
http协议 主机 端口 文件
HTTP的工作原理
访问:http://zuoye.driverzeng.com:8888/pic/1_oldboy_lnmp.jpg域名经过哪些流程
1.浏览器去请求DNS服务器
- 1)请求local DNS(本地DNS),zuoye.driverzeng.com绑定的IP
- 2)请求223.5.5.5 ,13个根域 迭代查询:先找.com 然后找driverzeng.com 最后找到zuoye.driverzeng.com 解析成192.168.3.250IP,把IP返回给浏览器
.com :
.org:开源域名
.net :互联网
.int :
.edu:教育域名
.gov:政府域名
.mil:
2.浏览器与192.168.3.250服务器的8888端口建立TCP连接
3.浏览器发送连接服务器的请求(三次握手):
- 1)浏览器向192.168.3.250服务器发送SYN
- 2)192.168.3.250服务器回复ACK给浏览器,同时发送SYN给浏览器
- 3)浏览器向服务器发送ACK确认建立连接
4.开始数据交流,浏览器使用GET方式请求URI(/pic/1_oldboy_lnmp.jpg)
5.服务器在站点目录下/pic目录里面找到图片1_oldboy_lnmp.jpg返回给浏览器
6.浏览器向服务器断开连接(四次挥手)
- 1)浏览器向服务器发送fin
- 2)服务器接收fin并返回ACK
- 3)服务器向浏览器发送fin(确定数据是否传输完成)
- 4)浏览器向服务器发送ACK
- 5)浏览器进入tmie_waitz状态
7.浏览器显示URL中的图片
HTTP 数据包分析
GET中的信息:请求头信息
GET /favicon.ico HTTP/1.1
Host: www.qqyewu.com
Connection: keep-alive
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)
Chrome/86.0.4240.198 Safari/537.36
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9
GET和HTTP之间有个空行:请求空行
HTTP中的信息:响应信息
HTTP/1.1 200 OK
Content-Type: text/html
Content-Encoding: gzip
Last-Modified: Fri, 15 Nov 2013 21:51:25 GMT
Accept-Ranges: bytes
ETag: "80ac72d44ce2ce1:0"
Vary: Accept-Encoding
Server: Microsoft-IIS/7.5
X-Powered-By: ASP.NET
Date: Tue, 13 Jul 2021 03:02:41 GMT
Content-Length: 1838
HTTP
与faa
之间也有个空行被称为:响应空行
faa
部分被称为:主体响应主体
页面内容
开发者工具Network
Elements:当前页面信息
Console:前端开发使用:修改代码,做调试
Sources:前端开发调试
Network:
Perfomance:前端开发手机调试
- General:基本信息
# 请求的URL
Request URL: http://zuoye.driverzeng.com:8888/
# 请求方法是 GET
Request Method: GET
# 状态码:200
Status Code: 200 OK
# 远端的地址
Remote Address: 192.168.3.250:8888
# referrer的策略
Referrer Policy: strict-origin-when-cross-origin
- Response Headers:响应头
# 响应大小Accept-Ranges: bytes# 长连接(可持续发送请求)Connection: Keep-Alive# 响应的内容长度Content-Length: 2633# 响应内容的类型;字符集Content-Type: text/html; charset=UTF-8# 日期Date: Tue, 13 Jul 2021 03:19:44 GMT# 长连接的超时时间,最大范围Keep-Alive: timeout=5, max=100# 代码返回:记录上一次的修改时间Last-Modified: Fri, 04 May 2018 08:13:44 GMT# 该网页部署在服务器的系统版本,以及服务版本Server: Apache/2.4.6 (CentOS) PHP/5.4.16
- Request Headers:请求头
# 允许服务端给浏览器传递哪些文本类型Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9# 压缩Accept-Encoding: gzip, deflate# 允许的语言Accept-Language: zh-CN,zh;q=0.9# 没有设置缓存Cache-Control: no-cache# 客户端的长连接Connection: keep-alive# 请求的主机(域名)Host: zuoye.driverzeng.com:8888# 请求参数(没有缓存)Pragma: no-cache# 谷歌浏览器自带Upgrade-Insecure-Requests: 1# 客户端的信息User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X)AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
Http的请求方法
方法(Method) | 含义 |
---|---|
GET | 请求读取一个Web页面(传递参数,在浏览器里可以看见) |
POST | 请求读取一个Web页面(传递参数看不见) |
DELETE | 删除Web页面 |
CONNECT | 用于代理服务器 |
HEAD | 请求读取一个Web页面的头部 |
PUT | 一般用于上传 |
TRACE | 用于测试,要求服务器送回收到的请求 |
OPTION | 查询特定选项 |
Http的响应方法
响应报文中的状态
状态码(status-code)是响应报文状态行中包含的一个3位数字,指明特定的请求是否被满足,如果没有满足,原因是什么。
状态码分为以下五类
状态码 | 含义 |
---|---|
200 | 成功 |
301 | 永久重定向(跳转) |
302 | 临时重定向(跳转) |
304 | 本地缓存 |
307 | 内部重定向(跳转) |
400 | 客户端错误 |
401 | 认证失败 |
403 | 找不到主页,权限不足 |
404 | 找不到页面 |
500 | 内部错误 |
502 | 找不到后端主机 |
503 | 服务器过载 |
504 | 后端主机超时 |
Http请求头信息
重要信息
User-Agent
User-Agent:浏览器标识(操作系统标识;加密等级标识;浏览器语言)渲染引擎标识 版本信息(客户端信息 )
Server
Server:响应头包含处理请求的原始服务器的软件信息
Referer
Referer:浏览器向 WEB 服务器表明自己是从哪个 网页/URL 获得/点击 当前请求中的网址/URL。
HTTP重定向
Location:WEB 服务器告诉浏览器,试图访问的对象已经被移到别的位置了,到该头部指定的位置去取
Htttp访问流程图
Http协议原理总结
1.用输入域名 - > 浏览器跳转 - > 浏览器缓存 - > Hosts文件 - > DNS解析(递归查询|迭代查询) 客户端向服务端发起查询 - > 递归查询 服务端向服务端发起查询 - > 迭代查询2.由浏览器向服务器发起TCP连接(三次握手) 客户端 -->请求包连接 -syn=1 seq=x 服务端 服务端 -->响应客户端syn=1 ack=x+1 seq=y 客户端 客户端 -->建立连接 ack=y+1 seq=x+1 服务端3.客户端发起http请求: 1)请求的方法是什么: GET获取 2)请求的Host主机是: blog.driverzeng.com 3)请求的资源是什么: /index.html 4)请求的端端口是什么: 默认http是80 https是443 5)请求携带的参数是什么: 属性(请求类型、压缩、认证、浏览器信息、等等) 6)请求最后的空行4.服务端响应的内容是 1)服务端响应使用WEB服务软件 2)服务端响应请求文件类型 3)服务端响应请求的文件是否进行压缩 4)服务端响应请求的主机是否进行长连接5.客户端向服务端发起TCP断开(四次挥手) 客户端 --> 断开请求 fin=1 seq=x --> 服务端 服务端 --> 响应断开 fin=1 ack=x+1 seq=y --> 客户端 服务端 --> 断开连接 fin=1 ack=x+1 seq=z --> 客户端 客户端 --> 确认断开 fin=1 ack=x+1 seq=sj --> 服务端
用户访问网站集群架构流程
1.客户端发起http请求,请求会先抵达前端的防火墙2.防火墙识别用户身份,正常的请求通过内部交换机通过tcp连接后端的负载均衡,传递用户的http请求3.负载接收到请求,会根据请求的内容进行下发任务,通过tcp连接后端的web,转发发用户的http请求4.web接收到用户的http请求后,会根据用户请求的内容进行解析,解析分为如下: 静态请求:web直接返回给负载均衡->防火墙->用户 动态请求:web向后端的动态程序建立TCP连接,将用户的动态http请求传递至动态程序->由动态程序进行解析5.动态程序在解析的过程中,如果碰到查询数据库请求,则优先与缓存建立tcp连接,并发起数据查询操作。6.如果缓存没有对应的数据,动态程序再次向数据库建立tcp连接,并发起查询操作。7.最后数据由, 数据库->动态程序->缓存->web服务->负载均衡->防火墙->用户。
Http相关术语
LAMP:linux Apache Mysql PhpLNMP:linux Nginx Mysql PhpLAMT:linux Apache Mysql TomcatLNMT:linux Nginx Mysql TomcatPV:页面独立的浏览量UV:独立设备IP:独立ip假设公司有一座大厦,大厦有100人,每个人有一台电脑和一部手机,上网都是通过nat转换出口,每个人点击网站2次, 请问对应的pv,uv,ip分别是多少?PV: 100*2*2 = 400UV: 1002*2 = 200IP: 1
SOA松耦合架构
面向服务的架构(SOA)是一个组件模型,它将应用程序的不同功能单元(称为服务)进行拆分,并通过这些服务之间定义良好的接口和契约联系起来。接口是采用中立的方式进行定义的,它应该独立于实现服务的硬件平台、操作系统和编程语言。这使得构建在各种各样的系统中的服务可以以一种统一和通用的方式进行交互。