图解HTTP(二)
本系列是对于《图解HTTP》的知识点整理。
《图解HTTP》出版于2014年,此时的HTTP2协议还未修订完成,故全书只讲解HTTP1.0、HTTP1.1以及会涉及到一点HTTP2.0依赖的协议。
本文涉及第四章至第五章的内容。
一、返回结果的HTTP状态码
1、状态码的类型
状态码如200 OK,由3位数字和原因短语组成。
只要遵守状态码类别的定义,及时改变RFC2616中定义的状态码,或服务器端自行创建状态码都没问题。
接下来仅介绍具有代表性的14个状态码。
2、2XX成功
2.1 200 OK
表示从客户端发来的请求在服务器端被正常处理了。
2.2 204 No Content
该状态码表示服务器接收的请求已成功处理,但在返回的响应报文中不含实体的主体部分,也不允许返回任何实体的主体。
一般在只需要从客户端往服务器端发送信息,而对客户端不需要发送新信息内容的情况下使用。
2.3 206 Partial Content
该状态码表示客户端进行了范围请求,而服务器成功执行了这部分的GET请求。响应报文中包含由Content-Range指定范围的实体内容。
3、3XX 重定向
3XX响应结果表示浏览器需要执行某些特殊的处理以正确处理请求。
3.1 301 Moved Permanently
永久性重定向。该状态码表示请求的资源已被分配了新的URI,以后应使用资源现在所指的URI。也就是说,如果已经把资源对应的URI保存为书签了,这时应该按Location首部字段提示的URI重新保存。
像下方给出的请求URI,当指定资源路径的最后忘记添加斜杠“/”,就会产生301状态码。
https://example.com/sample
3.2 302 Found
临时重定向。该状态码表示请求的资源已被分配了新的URI,希望用户(本次)能使用新的URI访问。
302状态码和301状态码相似,但有些不同。比如用户把URI保存为书签,在返回302后,会用新的URI去访问,但不会更新书签。
3.3 303 See Other
该状态码表示由于请求对应的资源存在着另一个URI,应使用GET方法定向获取请求的资源。
303状态码和302状态码有着相同的功能,但303状态码明确表示客户端应当采用GET方法获取资源。
3.4 304 Not Modified
该状态码表示客户端发送附带条件的请求①时,服务器端允许请求访问资源,但因发生请求未满足条件的情况后,直接返回304 Not Modified(服务器资源未改变,可直接使用客户端未过期的缓存)。304状态码返回时,不包含任何响应的主体部分。304虽然被划分在3XX类别中,但是和重定向没有关系。
【拓①】附带条件的请求是指采用GET方法的请求报文中包含if-Match,if-Modified-Since,if-None-Match,if-Range,if-Unmodified-Since中任一首部。
3.5 307 Temporary Redirect
临时重定向。该状态码与302 Found有着相同的含义。尽管302标准禁止POST变换成GET,但实际使用时大家并不遵守。
307会遵照浏览器标准,不会从POST变成GET。(但是,对于处理响应时的行为,每种浏览器有可能出现不同的情况)
4、4XX 客户端错误
4XX的响应结果表明客户端是发生错误的原因所在。
4.1 400 Bad Request
该状态码表示请求报文中存在语法错误。当错误发生时,需要修改请求的内容后再次发送请求。
另外,浏览器会像200 OK一样对待该状态码。
4.2 401 Unauthorized
该状态码表示发送的请求需要有通过HTTP认证(BASIC认证、DIGEST认证)的认证信息。另外若之前已进行过1次请求,则表示用户认证失败。
返回含有401的响应必须包含一个适用于被请求资源的WWW-Authenticate首部用以质询(challenge)用户信息。当浏览器首次接收到401响应,会弹出认证用的对话窗口。
4.3 403 Forbidden
该状态码表明对请求的资源的访问被服务器解决了。服务器可选择是否提供对于拒绝的详细说明,如果提供可在实体的主体部分对原因进行描述。
4.4 404 Not Found
该状态码表明服务器上无法找到请求的资源。除此之外,也可以在服务器端拒绝请求且不想说明理由时使用。
5、5XX服务器错误
5XX的响应结果表明服务器本身发生错误。
5.1 500 Internal Server Error
该状态码表明服务器端在执行请求时发生了错误。也可能是Web应用存在的bug或某些临时的故障。
5.2 503 Service Unavailable
该状态码表明服务器暂时处于超负荷或正在进行停机维护,现在无法处理请求。如果事先得知解除以上状况需要的时间,最好写入Retry-After首部字段再返回给客户端。
二、与HTTP协作的Web服务器
1、 用单台虚拟主机实现多个域名
HTTP/1.1规范允许一台HTTP服务器搭建多个Web站点,即使用虚拟主机(Virtual Host)的功能。即使物理层面只有一台服务器,但只要使用虚拟主机的功能,则可以假想已具有多台服务器。
客户端使用HTTP协议访问服务器时,如果访问的是一台服务器上托管的多个域名中的一个,此时使用DNS解析后的访问IP地址一致,需要在请求报文的Host首部字段中完整指定主机名或域名的URI。
2、通信数据转发程序:代理、网关、隧道
HTTP通信时,除客户端和服务器外,还有一些用于通信数据转发的应用程序。
代理
代理是一种有转发功能的应用程序,它扮演了位于服务器和客户端“中间人”的角色,接收由客户端发送的请求并转发给服务器,同时也接收服务器返回的响应并转发给客户端。
网关
网关是转发其他服务器通信数据的服务器,接收从客户端发送来的请求时,网关就像自己拥有资源的源服务器一样对请求进行处理。有时客户端可能都不会察觉,自己的通信目标是一个网关。
隧道
隧道 是在相隔甚远的客户端和服务器两者直接按进行中转,并保持双方通信连接的应用程序。
2.1 代理
代理服务器的基本行为就是转发。代理不改变请求URI,会直接发送给前方持有资源的目标服务器。
每次通过代理服务器转发请求或响应时,会追加写入Via首部信息。
使用代理服务器的理由有:利用缓存技术减少网路带宽的流量,组织内部针对特定网站的访问控制,以获取访问日志未主要目的,等等。
代理有多种使用方法,按两种基准分类。一种是是否使用缓存,另一种是是否会修改报文。
缓存代理
代理转发响应时,缓存代理(Caching Proxy)会预先将资源的副本(缓存)保存在代理服务器上。
当代理再次接接收到对相同资源的请求时,就可以不从源服务器那里获取资源,而是将之前缓存的资源作为响应返回。
透明代理
转发请求或响应时,不对报文做任何加工的代理类型被称为透明代理(Transparent Proxy)。反之,对报文内容进行加工的代理被称为非透明代理。
2.2 网关
网关的工作机制和代理十分相似。而网关能使通信线路上的服务器提供非HTTP协议服务。比如:网关可以连接数据库,使用SQL语句查询数据。另外,在Web购物网站上进行信用卡结算时,网关可以和信用卡结算系统联动。
2.3 隧道
隧道可按要求建立起一条与其他服务器的通信线路,届时使用SSL等加密手段进行通信。
隧道本身不会去解析HTTP请求。隧道会在通信双方断开连接时结束。
3、缓存
缓存是指代理服务器或客户端本地保存的资源副本。
当缓存服务器转发从服务器返回的响应时,代理服务器将会保存一份资源的副本。
缓存服务器的优势在于利用缓存可避免多次从源服务器转发资源。
3.1 缓存的有效期
缓存是具备有效期的。
缓存不仅可以存在缓存服务器内,还可以存在客户端浏览器中。一Internet Explorer程序为例,吧客户端缓存称为临时网络文件。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南