HTTP服务器
一、关于本文
文章从三个方面来简介HTTP服务器中的一些概念,目的在于引出概念。服务器与域名的关系、服务器与数据转发程序、服务区与缓存。
二、用单台服务器实现多个域名
HTTP/1.1规范允许一台HTTP服务器搭建多个Web站点。其中利用了虚拟主机(又称之为虚拟服务器)的功能。
但是需要客户端配合。
客户端使用HTTP协议访问服务器时,经常使用的是域名。在互联网上,域名经过DNS服务映射到IP地址之后访问目标网站。
在相同的IP地址下,由于虚拟主机可以寄存多个不同主机名和域名的Web网站,因此在发送HTTP请求时,必须在Host首部内完整指定主机名或域名的URI。
三、代理、网关、隧道
在HTTP通信中,除了客户端和服务器之外,还有一些用于通信数据转发的应用程序。
1、代理
代理是一种有转发功能的应用程序,它扮演了位于服务器和客户端“中间人”的角色,接受由客户端发送的请求并转发给服务器,同时也接受服务器返回的响应并转发给客户端。
代理不会改变客户端发起请求的URI。
持有资源实体的服务器称为源服务器。
在HTTP通信过程中,可级联多台代理服务器。转发是,需要附加Via首部字段以标记出经过的主机信息。
使用代理服务器的原因有:利用缓存技术减少网络带宽的流量,组织内部针对特定网站的访问,以获取访问日志。
代理服务器的分类标准有:是否使用缓存、是否修改报文。
缓存代理:代理转发响应时,缓存代理(Caching Proxy)会预先将资源的副本(缓存)保存在代理服务器上。当代理再次接收到对相同资源的请求时,就可以不从源服务器那里获取资源,而是将之前缓存的资源作为响应返回。
透明代理:转发请求或响应时,不对报文做任何加工的代理类型被称为透明代理(Transparent Proxy)。反之,对报文内容进行加工的代理被称为非透明代理。
2、网关
网关的工作机制和代理十分相似。但是,利用网关可以由HTTP请求转化为其他协议通信。
3、隧道
隧道可按要求建立起一条与其他服务器的通信线路,届时使用SSL等加密手段进行通信。隧道的目的是确保客户端能与服务器进行安全的通信。
隧道本身不会去解析HTTP请求。也就是说,请求保持原样中转给之后的服务器。隧道会在通信双方断开连接时结束。
通过隧道的传输,可以和远距离的服务器安全通信。隧道本身是透明的,客户端不用在意隧道的存在。
四、缓存
缓存是指代理服务器或客户端本地磁盘内保存的资源副本。利用缓存可减少对源服务器的访问,因此也就节省了通信的流量和通信时间。
缓存服务器就是代理服务器的一种,前面也已经介绍过。---
“缓存代理:代理转发响应时,缓存代理(Caching Proxy)会预先将资源的副本(缓存)保存在代理服务器上。当代理再次接收到对相同资源的请求时,就可以不从源服务器那里获取资源,而是将之前缓存的资源作为响应返回。”
客户端的缓存:比如IE浏览器把客户端缓存称为临时网络文件(Temporary Internet File)。
【缓存的有效性】如何验证缓存的有效性?可以根据时间来约定。也可以向源服务器确认资源的有效性,若判断缓存失效,再向源服务器获取新的资源。