【HTTP】Web服务器和HTTP的协作&HTTP首部
用单台虚拟主机实现多个域名
Web服务器可以搭建多个独立域名的Web网站,也可以作为通信路径上的中转服务器提升效率。
HTTP/1.1规范允许一台HTTP服务器搭建多个Web站点,提供Web托管服务的供应商,可以用一台服务器为多为客户服务,也可以以每位客户的域名允许各自不同的网站。
物理层面只有一台服务器,只要使用虚拟主机,即可相当于拥有多台服务器。
客户端通过主机名和域名访问服务器,域名通过DNS服务映射到IP地址后访问目标网站。所以当请求发送到服务器时,已经是以IP地址形式访问了。【如果一台服务器托管了多个域名,收到请求后需要直到访问哪个域名】
例如:www.web1.com 和 www.web2.com部署在一台服务器上,DNS解析后,二者的IP都是服务器的IP:XXX.XXX.XXX.XXX。
当IP地址相同时,由于虚拟主机可以寄存多个不同主机名或域名的web网站,所以发送HTTP请求时,必须在host首部内完整的指定主机名或域名。
通信数据转发
HTTP通信中还有一些用于通信转发的应用程序:代理、网关、隧道。可以配合服务器工作。
代理:有转发功能的应用程序,接收客户端的请求,转发给服务端。接收服务端响应,转发给客户端。
网关:转发其他服务器通信数据的服务器,接收从客户端发送来的请求时,像源服务器一样地对请求进行处理。
隧道:相隔很远的客户端和服务器两者之间进行中转,保持双方通信连接的应用程序。
一、代理
基本行为:接收客户端请求,转发给其他服务器。代理不改变URI,直接发送给持有资源的服务器(源服务器)。服务器的响应经由代理发送给客户端。
可以级联多台代理服务器,转发时需要附加Via首部字段,标记经过的主机信息。
使用代理的优势:利用缓存技术减少网络带宽流量。组织内部针对特定网络的访问控制,获取访问日志。
代理的分类:是否使用缓存、是否会修改报文。
缓存代理:代理在转发响应时,缓存代理预先将资源的副本保存在代理服务器上。下次接收到相同请求时,就可以不从源服务器获取资源,用缓存的资源作为返回。
透明代理:转发请求或响应时,不对报文做任何加工。否则就是非透明代理。
二、网关
网关的优势:
1. 可以使通信线路上的服务器提供非HTTP协议服务。
2. 可以提高通信的安全性,因为客户端和网关之间的通信线路可以加密,确保连接的安全。例如:网关可以连接数据库,使用SQL查询。网关可以和信用卡结算系统联动。
三、隧道
隧道可以按要求建立起一条和其他服务器的通信线路。使用SSL等加密手段进行通信。
隧道的目的:确保客户端和服务端进行安全的通信。
隧道不会解析HTTP协议,请求保持原样中转给服务器,在通信双方断开连接后结束。
四、资源的缓存
代理服务器或客户端的本地磁盘可以保存资源的副本,也就是缓存,利用缓存可以减少对服务器的访问,节省通信流量和通信时间。
当缓存被判定为过期后,会向源服务器确认资源的有效性,如果失效的话,会向源服务器请求新的资源。
HTTP首部
一、HTTP报文首部
HTTP的结构 = 报文首部+空行+报文主体
报文首部:客户端和服务端通信的重要信息
报文主体:用户信息/资源信息
HTTP请求报文
报文首部 = 请求行+请求首部字段+通用首部字段+实体首都字段+else
请求行 = 请求方式 + URI + HTTP版本
HTTP首部字段 = 请求首部字段+通用首部字段+实体首都字段
HTTP响应报文
报文首部 = 状态行+响应首部字段+ 通用首部字段+实体首都字段+else
状态行 = HTTP版本+状态码
二、HTTP首部字段
首部字段:提供报文主体大小、使用的语言、认证信息等内容
首部字段的结构 —— 首部字段名:字段值
例如:Content-Type: text/html Keep-Alive: timeout=15, max=100
1. 通用首部字段:请求报文和响应报文都会使用
2. 请求首部字段:请求报文中使用,补充请求的附加内容、客户端信息、响应内容相关优先级信息。
3. 响应首部字段:响应报文中使用,补充响应的附加信息,要求客户端附加的额外的内容信息。
4. 实体首部字段:补充资源内容更新时间等和实体相关的信息。
三、HTTP/1.1 通用首部字段
1. Cache-Control
用于操作缓存的工作机制。
Cache-Control: private, max-age=0, no-cache
指令 | 参数 | 说明 |
no-cache | / | 必须向源服务器验证 |
no-store | / | 不缓存请求或响应的任何内容 |
max-age=?[s] | 必需 | 响应的最大时间 |
max-stale=?[s] | 可省略 | 接收已经过期的响应 |
min-fresh=?[s] | 必需 | 期望在指定时间内的响应仍有效 |
no-transform | / | 代理不可更改媒体类型 |
only-if-cached | / | 从缓存获取资源 |
cache-extension | - | 新指令标记 |
public | / | 可以向任意方提供响应的缓存 |
private | 可省 | 仅向特定用户返回响应 |
no-cache | 可省 | 缓存前必须先确认有效性 |
no-store | / | 不缓存 |
no-transform | / | 代理不可更改媒体类型 |
must-revalidate | / | 可缓存但必须向源服务器确认 |
proxy-revalidate | / | 要求中间缓存服务器对缓存的响应有效性进行确认 |
max-age=[s] | 必需 | 响应的最大值 |
s-maxage=[s] | 必需 | 公共缓存服务器响应的最大值 |
cache-extension | - | 新指令标记 |
2. 表明是否能缓存的指令
public:表明其他用户也可以利用缓存
private:只有特定用户才能使用缓存
no-cache:防止从缓存中返回过期的资源。客户端设置no-cache则不会接收缓存过的响应,缓存服务器要把请求转发给服务端。服务端设置no-cache则缓存服务器不能对资源进行缓存,也就不需要验证缓存服务器资源的有效性。
Cache-Control:no-cache=Location。客户端接收到有参的首部字段对应的响应报文后不能使用缓存。无参的首部字段可以使用缓存。
注意:no-cache不是不缓存,是不缓存过期的资源。no-store才是不缓存。
3. 指定缓存期限和认证的指令
s-maxage & max-age:前者只能用于供多位用户使用的公共缓存服务器。(一位用户没有任何作用)用了s-maxage会忽略Expires首部字段和max-age指令。
如果没有超期,则发送缓存,如果超期,则向源服务器验证。
min-fresh:要求缓存服务器返回至少还未过指定时间的缓存资源。超过的资源无法作为响应返回。
max-stale:可指示缓存资源,即使过期也照样接收。【有参数,在参数时间内,照样接收,无参数,永久照样接收】
only-if-cached:只在缓存服务器有缓存的时候才返回。没有响应的话返回504 Gateway Timeout
must-revalidate:代理会向源服务器再次验证即将返回的响应缓存目前是否有效。如果代理无法再次获取有效资源,返回504。该指令会忽略max-stale指令。
proxy-revalidate:缓存服务器必需再次验证缓存的有效性。
no-transform:不可以改变实体主体的媒体类型,防止缓存或代理压缩图片等操作。
4. Connection首部字段
作用:控制不再转发给代理的首部字段,管理持久连接。
HTTP/1.1默认持久连接,Connection:close可以断开连接。
HTTP/1.1之前非持久连接,所以在旧版本上持续连接需要指定Connection:Keep-alive
5. Date首部字段
表明创建HTTP报文的日期和时间
6. Pragma
作为HTTP/1.0的向后兼容 Pragma:no-cache
用于兼容不同的HTTP协议版本
7. Trailer
事先说明报文主体后面写了哪些首部字段。应用于HTTP/1.1版本分块传输编码时。
8. Transfer-Encoding
规定传输报文主体时采用的编码方式(HTTP/1.1只对分块传输编码有效)
9. Upgrade
用于检测HTTP协议及其他协议是否可以使用更高的版本进行通信,参数值可以用来指定一个完全不同的通信协议。
10. Via
用于追踪客户端与服务端之间的请求和响应报文的传输路径。报文经过代理和网关时,会在首部字段Via中附加该服务器的信息,然后进行转发。
还可以避免请求回环的发生。
11. Warning
HTTP/1.1的warning是从HTTP/1.0的响应头部Retry-After演变过来的。会告知用户一些关于缓存的问题的警告。
警告码:
110:响应已过期
111:再验证失败,代理再验证资源有效性的时候,服务器访问出现问题
112:断开连接
113:试探性过期,响应的使用期超过24小时(有效缓存设定时间大于24小时时)
199:杂项警告:任意的警告内容
214:使用了转换,代理对内容编码或媒体类型执行了某些处理
299:持久杂项警告:任意的警告内容
四、请求首部字段
五、响应首部字段
六、实体首部字段
七、为Cookie服务的首部字段
八、其他首部字段