一、概述

  缓存机制也就是我们说的HTTP缓存机制,其机制是根据HTTP报文的缓存标识进行的。
  • HTTP请求(Request)报文,报文格式为:请求行 – HTTP头(通用信息头,请求头,实体头) – 请求报文主体(只有POST才有报文主体)
  • HTTP响应(Response)报文,报文格式为:状态行 – HTTP头(通用信息头,响应头,实体头) – 响应报文主体

二、缓存过程

  • 浏览器与服务器通信的方式为应答模式,即是:浏览器发起HTTP请求 – 服务器响应该请求。

  • 那么浏览器第一次向服务器发起该请求后拿到请求结果,会根据响应报文中HTTP头的缓存标识,决定是否缓存结果,是则将请求结果和缓存标识存入浏览器缓存中。

浏览器每次发起请求,都会先在浏览器缓存中查找该请求的结果以及缓存标识。
浏览器每次拿到返回的请求结果都会将该结果和缓存标识存入浏览器缓存中。

三、强制缓存

  • 强制缓存就是向浏览器缓存查找该请求结果,并根据该结果的缓存规则来决定是否使用该缓存结果的过程,强制缓存的情况主要有三种:

  1、第一种:

  不存在该缓存结果和缓存标识,强制缓存失效,则直接向服务器发起请求(跟第一次发起请求一致)

  2、第二种:

  存在该缓存结果和缓存标识,但该结果已失效,强制缓存失效,则使用协商缓存

  3、第三种:

  存在该缓存结果和缓存标识,且该结果尚未失效,强制缓存生效,直接返回该结果

  • 控制强制缓存的字段分别是Expires和Cache-Control,其中Cache-Control优先级比Expires高

   Expires

  • Expires是HTTP/1.0控制网页缓存的字段,其值为服务器返回该请求结果缓存的到期时间,即再次发起该请求时,如果客户端的时间小于Expires的值时,直接使用缓存结果。

  • 缺陷:如果客户端与服务端的时间因为某些原因(例如时区不同;客户端和服务端有一方的时间不准确)发生误差,那么强制缓存则会直接失效

  • 到了HTTP/1.1,Expire已经被Cache-Control替代

  Cache-Control

  主要取值为:

  1、public:所有内容都将被缓存(客户端和代理服务器都可缓存)

  2、private:所有内容只有客户端可以缓存,Cache-Control的默认取值

  3、no-cache:不进行强制缓存,但是是否使用缓存则需要经过协商缓存来验证决定

  4、no-store:所有内容都不会被缓存,即不使用强制缓存,也不使用协商缓存

  5、max-age=xxx (xxx is numeric):缓存内容将在xxx秒后失效

  • 由于Cache-Control的优先级比expires,那么直接根据Cache-Control的值进行缓存,意思就是说在600秒内再次发起该请求,则会直接使用缓存结果,强制缓存生效。

  浏览器的缓存存放在哪里,如何在浏览器中判断强制缓存是否生效?

  • 请求对应的Size值则代表该缓存存放的位置,分别为from memory cache 和 from disk cache

  • from memory cache代表使用内存中的缓存,from disk cache则代表使用的是硬盘中的缓存,浏览器读取缓存的顺序为memory –> disk。

  • 内存缓存(from memory cache),会将编译解析后的文件,直接存入该进程的内存中,占据该进程一定的内存资源,以方便下次运行使用时的快速读取。

  • 一旦该进程关闭,则该进程的内存缓存则会清空。

  • 硬盘缓存(from disk cache):则是直接将缓存写入硬盘文件中,读取缓存需要对该缓存存放的硬盘文件进行I/O操作,然后重新解析该缓存内容,读取复杂,速度比内存缓存慢。

在浏览器中,浏览器会在js和图片等文件解析执行后直接存入内存缓存中,那么当刷新页面时只需直接从内存缓存中读取(from memory cache);
而css文件则会存入硬盘文件中,所以每次渲染页面都需要从硬盘读取缓存(from disk cache)。

四、协商缓存

  • 强制缓存失效后,浏览器携带缓存标识向服务器发起请求,由服务器根据缓存标识决定是否使用缓存的过程,主要有以下两种情况:

  1、第一种

  协商缓存生效,返回304

   2、第二种

  协商缓存失效,返回200和请求结果结果

协商缓存的标识也是在响应报文的HTTP头中和请求结果一起返回给浏览器的。
控制协商缓存的字段分别有:Last-Modified / If-Modified-Since和Etag / If-None-Match,其中Etag / If-None-Match的优先级比Last-Modified / If-Modified-Since高。

  Last-Modified / If-Modified-Since

  • Last-Modified是服务器响应请求时,返回该资源文件在服务器最后被修改的时间

  • If-Modified-Since则是客户端再次发起该请求时,携带上次请求返回的Last-Modified值,通过此字段值告诉服务器该资源上次请求返回的最后被修改时间。

  • 服务器收到该请求,发现请求头含有If-Modified-Since字段,则会根据If-Modified-Since的字段值与该资源在服务器的最后被修改时间做对比,若服务器的资源最后被修改时间大于If-Modified-Since的字段值,则重新返回资源,状态码为200;否则则返回304,代表资源无更新,可继续使用缓存文件。


  Etag / If-None-Match

  • Etag是服务器响应请求时,返回当前资源文件的一个唯一标识(由服务器生成)

  • If-None-Match是客户端再次发起该请求时,携带上次请求返回的唯一标识Etag值。
  • 通过此字段值告诉服务器该资源上次请求返回的唯一标识值。服务器收到该请求后,发现该请求头中含有If-None-Match,则会根据If-None-Match的字段值与该资源在服务器的Etag值做对比,一致则返回304,代表资源无更新,继续使用缓存文件;不一致则重新返回资源文件,状态码为200。

注:Etag / If-None-Match优先级高于Last-Modified / If-Modified-Since,同时存在则只有Etag / If-None-Match生效。

  为什么有Etag?

主要是为了解决几个Last-Modified比较难解决的问题:

1、一些文件也许会周期性的更改,但是他的内容并不改变(仅仅改变的修改时间),这个时候我们并不希望客户端认为这个文件被修改了,而重新GET;

2、某些文件修改非常频繁,比如在秒以下的时间内进行修改,(比方说1s内修改了N次),If-Modified-Since能检查到的粒度是s级的,这种修改无法判断;

五、nginx中缓存配置