4、http协议之二
URL(Unifrom Resource Locator)简述
相对URL 从当前页面(同一个站点内或同一个文章内引用)
绝对URL 从当前页面或其他页面跳转而来(跨站引用)
HTTPD版本<0.9文本><1.0,method,mime,弱缓存><1.1持久连接><2.0,mime,spdy,缓存,method>
HTTPD特性:无状态、文本编码协议<telnet, curl, enlinks>
追踪用户来源的机制:cookie(重cookie,轻cookie),session
Cookie分类
Cookie工作机制: 随机数惟一标识用户
轻cookie应用: 数据结构保存cookie与session的映射
100信息
200 OK 成功
301 Moved Permantly 永久 302 Found 临时 304 Not Modified 条件
401 WWW-Authenticate 质询认证 403 Forbidden 没有权限访问 404 Not Found 没有资源
500 Internal Server Error 服务内部错误 502 Bad Gateway 错误网关
一、URL
Uniform Resource Locator 标识每个资源的位置 URL是URI的子集
相对URL:相对当前页面的URL,(相对路径:由当前工作目录起始的路径)
绝对URL:用于跨站引用或当前页面,(绝对路径:由/起始的路径)
二、HTTPD版本
2.1、HTTPD特性
- http stateless 无状态 服务器无法持续追踪访问者来源
- 文本编码协议
2.2、追踪用户来源的机制
动态站点中用来追踪并保存用户浏览行为的或访问行为的重要机制:Cookie ,session
2.2.1、Cookie工作方式(相当于第一次访问某服务器时候,此service发给client的令牌)
二次通信:
服务器 接收随机数(令牌) <-- 客户端 将访问的服务器首次所发的令牌发给服务器,用于标明自己的身份
2.2.2、Cookie分类
重cookie:有可能会泄露用户隐私
轻cookie:只记录少量的信息
免费的杀毒软件,可以获取磁盘底层的信息最高权限,有的放矢的投放广告
2.2.3、Session:<轻cookie:减小隐私信息丢失的可能性>,在服务器端在进程内存中维护Session
2.3、HTTP事务
一次httpd请求request对应一次响应respone,即为事务
事务元数据:(起始行+headers)
实体:entity-body部分
HTTP请求响应报文详解
2.3.1、请求报文语法
<method> <requeset-url> <version> 请求报文http首部---请求行
<header> 首部
换行1
换行2
<entity-body> 请求的主体内容
2.3.2、响应报文语法
<version> <status> <reason-phrase>;响应的原因
<header>
换行1
换行2
<entity-body>
2.3.3、method 请求方法,标明客户端希望服务器端对资源执行的动作(客户端告诉服务器做什么)
POST 向服务器发送要处理的数据,请求实体不为空 (危险)
PUT 将请求的主体部分存储在服务器上,请求实体不为空 (非常危险)
DELETE 请求删除服务器上,通过URL指定的文档 (更危险)
2.3.4、status code 服务器告诉客户端结果 统一三位数字,原因短语---标记请求过程中所发生的情况
常用的状态码:
200 :成功,请求的所有数据通过响应报文的entity-body部分发送: OK
301:请求的URL指向的资源已经被删除;但在响应报文中通过首部Location指明了资源现在所处的新位置:Moved Permanently
302:与301相似,但是在响应报文中通过Location指明资源现在所处临时新位置;Found
304:客户端发生了条件式请求,但服务器上的资源未曾发生改变,则通过响应此响应状态码通知客户端:Not Modified
401:需要输入账号和密码认证方能访问资源:Unauthorized
403:请求被禁止:Forbidden
404:服务器无法找到客户端请求的资源:Not Found
500:服务器内部错误:Internal Server Error
502:代理服务器从后端服务器收到一条伪响应 :Bad Gateway
2.3.5、reason-phrase 原因短语 状态码标记的状态简要描述
2.3.6、 headers 首部------用来标记请求或响应的属性
headers 请求和响应首部: 标记请求或响应的属性 , 事务交换的元数据信息
负载均衡调度时,可以根据首部调度
1、首部可以有多个
2、首部的格式:Directive: value
每个请求或响应报文可包含任意个首部;每个首部都有首部名称,后面跟一个冒号,而后跟上一个可选空格,接着是一个值;
首部的分类:
- 通用首部:(既可以用在请求报文或者响应报文首部中)
- Date :报文的创建时间
- Connection:表示是否需要持久连接状态,如http1.1默认进行keep-alive,close
- Via :显示报文经过的中间节点
- Transfer-Encoding:规定了传输报文主体时采用的编码方式
- Cache-Control : 控制缓存
-
-
- no-cache:先发送请求,与服务器确认该资源是否被更改,如果未被更改,则使用缓存。
- no-store:不允许缓存,每次都要去服务器上,下载完整的响应。
- public:缓存所有的响应(提高了响应速度,但是对存储空间的利用率很低)
- private:只为单个用户缓存,不允许任何中继进行缓存(比如CDN(分发网络)就不能缓存这种规定下的响应)
- max-age: 表示当前请求开始,该响应在多久内能被缓存和重用。例如:max-age=60表示响应可以再缓存和重用 60 秒。
-
-
- Pragma :兼容HTTP/1.0或HTTP/1.1
- 请求首部(自己可接受的特性)
- Accept :通知服务器能自己可接受的媒体类型
- Accept-Charset : 接受字符集类型
- Accept-Encoding :接受哪种编码压缩格式,如:gzip, deflate, br
- Accept-Language:接受的语言
-
Host: 请求的服务器名称和端口号blog.51cto.com
-
Referer: 包含当前正在请求的资源的上一级资源(访问入口)https://blog.51cto.com/sonlich/1968933
-
User-Agent: 客户端代理(即浏览器的类型)Mozilla/5.0 (Windows NT 10.0; Win64; x64)
- 条件式请求首部 (和缓存有关)
- Expect
- If-Modified-Since:自从指定的时候之后,请求的资源是否发生过修改
- If-Unmodified-Since
- If-None-Match:本地缓存中存储的文档的ETag标签是否与服务器文档的ETag不匹配
- If-Match:
- 安全请求首部:
- Authorization:向服务器发送认证信息,如账号和密码
- Cookie:客户端向服务器发送cookie
- Cookie2 version 2
- 代理请求首部
- Proxy-Authorization:向代理服务器认证
- 响应首部
- 信息性
- Age :响应持续时长
- Server:服务器程序软件名和版本
- 协商首部:某资源有多种表示方法时使用
- Accept-Ranges :服务器可接受的请求范围类型
- Vary :服务器查看的其它首部列表
- 安全响应首部
- Set-Cookie :向客户端设置cookie
- Set-Cookie2 版本
- WWW-Authenticate:来自服务器的对客户端的质询认证表单
- 信息性
- 实体首部:描述entity-body的信息
- Allow :列出对此实体可使用的请求方法
- Location:告诉客户端真正的实体位于何处
- 内容格式:
- Content-Encoding :内容的编码格式
- Content-Language:内容的语言
- Content-Length:内容的大小
- Content-Locating:实体真正的位置
- Content-Type :MIME类型
- 缓存相关
- ETag :实体的额外标签,基于标签的条件式请求
- Expires :实体过期时间
- Last-Modified :实体最近一次修改的时间
- 扩展首部:额外添加的首部
2.3.7、entity-body :实体-----有用的数据块,请求时附加的数据或响应时附加的数据
反向代理:将自己扮演为服务端接收请求,支持缓存,拆封报文并重新封装
正向代理:将自己扮演为客户端发起请求
重定向
条件式请求
用户质询认证
Forbidden 请求被禁止,IP控制或用户访问控制不通过时
404 用户请求一个不存在的资源
错误网关:
示例