图解HTTP(二)

本系列是对于《图解HTTP》的知识点整理。

《图解HTTP》出版于2014年,此时的HTTP2协议还未修订完成,故全书只讲解HTTP1.0、HTTP1.1以及会涉及到一点HTTP2.0依赖的协议。

本文涉及第四章至第五章的内容。

 

一、返回结果的HTTP状态码

1、状态码的类型

 

  状态码如200 OK,由3位数字和原因短语组成。

  只要遵守状态码类别的定义,及时改变RFC2616中定义的状态码,或服务器端自行创建状态码都没问题。

  接下来仅介绍具有代表性的14个状态码。

 2、2XX成功

2.1 200 OK

  表示从客户端发来的请求在服务器端被正常处理了。

 

2.2 204 No Content 

  该状态码表示服务器接收的请求已成功处理,但在返回的响应报文中不含实体的主体部分,也不允许返回任何实体的主体。

  一般在只需要从客户端往服务器端发送信息,而对客户端不需要发送新信息内容的情况下使用。

 

2.3 206 Partial Content

  该状态码表示客户端进行了范围请求,而服务器成功执行了这部分的GET请求。响应报文中包含由Content-Range指定范围的实体内容。

 

3、3XX 重定向 

  3XX响应结果表示浏览器需要执行某些特殊的处理以正确处理请求。

3.1 301 Moved Permanently

  永久性重定向。该状态码表示请求的资源已被分配了新的URI,以后应使用资源现在所指的URI。也就是说,如果已经把资源对应的URI保存为书签了,这时应该按Location首部字段提示的URI重新保存。

  像下方给出的请求URI,当指定资源路径的最后忘记添加斜杠“/”,就会产生301状态码。

https://example.com/sample

3.2 302 Found

  临时重定向。该状态码表示请求的资源已被分配了新的URI,希望用户(本次)能使用新的URI访问。

  302状态码和301状态码相似,但有些不同。比如用户把URI保存为书签,在返回302后,会用新的URI去访问,但不会更新书签。

 

3.3 303 See Other 

  该状态码表示由于请求对应的资源存在着另一个URI,应使用GET方法定向获取请求的资源。

  303状态码和302状态码有着相同的功能,但303状态码明确表示客户端应当采用GET方法获取资源。

3.4 304 Not Modified

  该状态码表示客户端发送附带条件的请求①时,服务器端允许请求访问资源,但因发生请求未满足条件的情况后,直接返回304 Not Modified(服务器资源未改变,可直接使用客户端未过期的缓存)。304状态码返回时,不包含任何响应的主体部分。304虽然被划分在3XX类别中,但是和重定向没有关系。

【拓①】附带条件的请求是指采用GET方法的请求报文中包含if-Match,if-Modified-Since,if-None-Match,if-Range,if-Unmodified-Since中任一首部。

3.5 307 Temporary Redirect

  临时重定向。该状态码与302 Found有着相同的含义。尽管302标准禁止POST变换成GET,但实际使用时大家并不遵守。

  307会遵照浏览器标准,不会从POST变成GET。(但是,对于处理响应时的行为,每种浏览器有可能出现不同的情况)

4、4XX 客户端错误

  4XX的响应结果表明客户端是发生错误的原因所在。

4.1 400 Bad Request

  该状态码表示请求报文中存在语法错误。当错误发生时,需要修改请求的内容后再次发送请求。

  另外,浏览器会像200 OK一样对待该状态码。

 

 4.2 401 Unauthorized

  该状态码表示发送的请求需要有通过HTTP认证(BASIC认证、DIGEST认证)的认证信息。另外若之前已进行过1次请求,则表示用户认证失败。

  返回含有401的响应必须包含一个适用于被请求资源的WWW-Authenticate首部用以质询(challenge)用户信息。当浏览器首次接收到401响应,会弹出认证用的对话窗口。

 

 4.3 403 Forbidden

  该状态码表明对请求的资源的访问被服务器解决了。服务器可选择是否提供对于拒绝的详细说明,如果提供可在实体的主体部分对原因进行描述。

 

4.4 404 Not Found 

  该状态码表明服务器上无法找到请求的资源。除此之外,也可以在服务器端拒绝请求且不想说明理由时使用。

 

5、5XX服务器错误

  5XX的响应结果表明服务器本身发生错误。

5.1 500 Internal Server Error

  该状态码表明服务器端在执行请求时发生了错误。也可能是Web应用存在的bug或某些临时的故障。

 

5.2 503 Service Unavailable

  该状态码表明服务器暂时处于超负荷或正在进行停机维护,现在无法处理请求。如果事先得知解除以上状况需要的时间,最好写入Retry-After首部字段再返回给客户端。

二、与HTTP协作的Web服务器

1、 用单台虚拟主机实现多个域名

  HTTP/1.1规范允许一台HTTP服务器搭建多个Web站点,即使用虚拟主机(Virtual Host)的功能。即使物理层面只有一台服务器,但只要使用虚拟主机的功能,则可以假想已具有多台服务器。

  客户端使用HTTP协议访问服务器时,如果访问的是一台服务器上托管的多个域名中的一个,此时使用DNS解析后的访问IP地址一致,需要在请求报文的Host首部字段中完整指定主机名或域名的URI。

2、通信数据转发程序:代理、网关、隧道

  HTTP通信时,除客户端和服务器外,还有一些用于通信数据转发的应用程序。

代理

  代理是一种有转发功能的应用程序,它扮演了位于服务器和客户端“中间人”的角色,接收由客户端发送的请求并转发给服务器,同时也接收服务器返回的响应并转发给客户端。

网关

  网关是转发其他服务器通信数据的服务器,接收从客户端发送来的请求时,网关就像自己拥有资源的源服务器一样对请求进行处理。有时客户端可能都不会察觉,自己的通信目标是一个网关。

隧道

  隧道 是在相隔甚远的客户端和服务器两者直接按进行中转,并保持双方通信连接的应用程序。

2.1 代理

  代理服务器的基本行为就是转发。代理不改变请求URI,会直接发送给前方持有资源的目标服务器。

  每次通过代理服务器转发请求或响应时,会追加写入Via首部信息。

 

  使用代理服务器的理由有:利用缓存技术减少网路带宽的流量,组织内部针对特定网站的访问控制,以获取访问日志未主要目的,等等。

  代理有多种使用方法,按两种基准分类。一种是是否使用缓存,另一种是是否会修改报文。

缓存代理

  代理转发响应时,缓存代理(Caching Proxy)会预先将资源的副本(缓存)保存在代理服务器上。

  当代理再次接接收到对相同资源的请求时,就可以不从源服务器那里获取资源,而是将之前缓存的资源作为响应返回。

透明代理

  转发请求或响应时,不对报文做任何加工的代理类型被称为透明代理(Transparent Proxy)。反之,对报文内容进行加工的代理被称为非透明代理。

2.2 网关

  网关的工作机制和代理十分相似。而网关能使通信线路上的服务器提供非HTTP协议服务。比如:网关可以连接数据库,使用SQL语句查询数据。另外,在Web购物网站上进行信用卡结算时,网关可以和信用卡结算系统联动。

 

 2.3 隧道

  隧道可按要求建立起一条与其他服务器的通信线路,届时使用SSL等加密手段进行通信。

  隧道本身不会去解析HTTP请求。隧道会在通信双方断开连接时结束。

 

 3、缓存

  缓存是指代理服务器或客户端本地保存的资源副本。

  当缓存服务器转发从服务器返回的响应时,代理服务器将会保存一份资源的副本。

  缓存服务器的优势在于利用缓存可避免多次从源服务器转发资源。

 

 3.1 缓存的有效期

  缓存是具备有效期的。

 

   缓存不仅可以存在缓存服务器内,还可以存在客户端浏览器中。一Internet Explorer程序为例,吧客户端缓存称为临时网络文件。

   

posted @ 2022-07-25 19:10  幻cat  阅读(31)  评论(0编辑  收藏  举报