总要有人来改变世界的,为什么不能是你呢

Http权威指南(服务器、缓存)

对于web服务器(软件)大家应该不会陌生,常见的web服务器有Apache、IIS、Tomcat、Nginx、Jetty等等。

1.基本功能

几乎所有的web服务器都会执行以下几项同样的任务:

1.建立连接:接受一个客户端连接,或者将其关闭;

2.接收请求:从网络中读取一条HTTP请求报文;

3.处理请求:对请求报文进行解释,并采取行动;

4.访问资源:访问报文中指定的资源;

5.构建响应:创建带有正确首部的HTTP响应报文;

6.发送响应:将响应回送给客户端;

7.记录日志:将事务处理记录在一个日志文件中。

说到web服务器自身的日志功能,这里有两个实用的web服务器日志:

access.log:这是服务器的访问日志,记录了每一次的Http请求过程,包括用户的IP,请求的资源(接口);

error.log:错误日志,当出现报错(代码报错)时,会记录哪个文件的哪一行在执行过程中出错了;

对于访问日志的功能,当你的网站出现漏洞时,有时候会有人通过漏洞牟利,这时候你可以根据访问日志来追踪

是自己的哪行代码出现了漏洞,进而去修复漏洞。

2.代理

代理服务器就是代理客户端执行请求的服务器  

代理服务器的角色既是客户端又是服务端,这个相信不难理解。

代理服务器可以对客户端的请求进行处理,一般有访问控制、web缓存、转码器等等

3.缓存

缓存机制是用来提高性能,降低网络通讯费用的

通常设有缓存的服务器请求是这样的:

1.接收:缓存从网络中读取抵达的报文;

2.解析:缓存对报文解析,提取URL和各种首部;

3.查询:缓存看缓存服务器上有没有副本可用,如果没有,就从源服务器获取一份副本并保存;

4.新鲜度检测:缓存服务器如果有副本可用,就查看副本是否够新鲜(是否过期),如果不够新鲜,就询问源服务器

是否有任何更新;

5.创建响应:缓存会用新的首部和已缓存的主体构建一条报文;

6.发送:将响应发给客户端;

7.日志:缓存服务器创建日志。

针对新鲜度检测这块,我随意找了一个http响应头来说明一下:

这是百度首页的一张图片的响应报文,(说明一下,当前时间为2018-08-07 01:37)

我们可以看到,Data首部的时间为7月31号的16:45,也就是说从缓存服务器拿到的副本是7月31号 16:45的存储版本;

而这个副本的过期时间是8月16号 17:48,也就是说在此时间之前,缓存服务器都不用去源服务器进行新鲜度检测;

假设现在是8月16号18:00,我们请求这同一张图片,缓存服务器一看,该副本过期了,那是不是直接去原服务器请求新

的资源呢?不是的,缓存会与源服务器进行核对,该文档是不是有被修改(更新),如果修改了,那就拿一份新的,存

到缓存服务器上并响应出去,如果没被修改,那么缓存只需要获取新的首部(包括一个新的过期时间),并对缓存中的

首部进行更新就可以了。这就是服务器再验证

上面Expires定义了该缓存的过期日期(绝对时间),Cache-Control:max-age也是过期时间(相对时间/段)

 

posted @ 2018-08-06 02:21  桔子桑  阅读(531)  评论(0编辑  收藏  举报