HTTP笔记-2--代理
代理
单个客户端专用的代理称为私有代理,众多客户端共享的代理被称为公共代理
代理与网关的对比:代理连接的是两个或多个使用相同协议的应用程序,而网关连接的则是两个或多个使用不同协议的端点。网关扮演的是“协议转换器”的角色,即使客户端和服务器使用的是不同的协议,客户端也可以通过它完成与服务器之间的事务处理。
为什么使用代理
代理服务器可以看到并接触到所有流过的HTTP流量,所以代理可以监视流量并对其进行修改,以实现很多有用的增值Web服务,比如儿童过滤器,文档访问控制,安全防火墙,web缓存,反向代理,内容路由器,转码器,匿名者。
反向代理
代理可以假扮Web服务器。这些被称为替代物或反向代理的代理接收发给Web服务器的真实请求,但与Web服务器不同的是,它们可以发起与其它服务器的通信,以便按需定位所请求的内容。
可以用这些反向代理来提高访问慢速Web服务器上公共内容时的性能。在这种配置中,通常将这些反向代理称为服务器加速器。还可以将替代物与内容路由功能配合使用,以创建按需复制内容的分布式网络。
四种常见方式可以使客户端流量流向代理:
修改客户端:如果将客户端配置为使用代理服务器,客户端就会将HTTP请求有意地直接发送给代理,而不是原始服务器;
修改网络:依赖于监视HTTP流量的交换设备及路由设备,在客户端毫不知情的情况下,对其进行拦截,并将流量导入一个代理。这种代理被称为拦截代理。
修改DNS的命名空间:
修改Web服务器:可以将某些Web服务器配置为向客户端发送一条HTTP重定向命令(响应码为305),将客户端请求重定向到一个代理上去。收到重定向命令后,客户端会与代理进行通信
客户端代理的设置
手工配置:显式地设置要使用的代理。
预先配置浏览器:浏览器厂商或发行商会在将浏览器发送给其客户之前预先对浏览器的代理设置进行手工配置。
代理的自动配置:提供一个URI,指向一个用JavaScript语言编写的代理自动配置文件;客户端会取回这个JavaScript文件,并运行它以决定是否应该使用一个代理,如果是的话,应该使用哪个代理服务器;
WPAD的代理发现:
有些浏览器支持Web代理自动发现协议,这个协议会自动检测出浏览器可以从哪个“配置服务器”下载到一个自动配置文件。
URI的客户端自动扩展和主机名解析
没有代理时URI的解析:没有提供显式的代理时,浏览器会对部分主机名进行自动扩展。
有显式代理时URI的解析:使用显式代理时,用户的URI会被直接发送给代理,所以浏览器就不再执行所有这些便捷的扩展功能了。有些代理会尽力尝试着去模仿浏览器的便捷服务,包括www...com自动扩展,以及添加本地域名后缀。
追踪报文:
随着代理的逐渐流行,我们要能够追踪经过代理的报文流,以检测出各种问题,其重要性就跟追踪经过不同交换机和路由器传输的IP分组流一样。可以通过Via首部和Track方法。
代理认证:
代理可以作为访问控制设备使用。HTTP定义了一种名为代理认证的机制,这种机制可以阻止对内容的请求,直到用户向代理提供了有效的访问权限证书为止。对受限内容的请求到达一台代理服务器时,代理服务器可以返回一个要求使用访问证书的407 Proxy Authorization Required状态码。
代理的互操作性
Options:发现对可选特性的支持,通过使用Options,客户端可以在与服务器进行交互之前,确定服务器的能力,这样它就可以方便地与具备不同特性的代理和服务器进行互操作了。Http/1.1在响应中唯一指定的首部字段是Allow首部,这个首部用于描述服务器所支持的各种方法(或者服务器上的特定资源).Options允许在可选的响应主体包含更多的信息,但并没有对这种用法进行定义。