浏览器缓存
前言
在前端开发中,缓存有利于加快网页的加载速度,同时缓存能够被反复利用,所以可以减少流量和带宽的开销。
缓存的分类有很多种,CDN缓存、数据库缓存、代理服务器缓存和浏览器缓存。本篇将来讲解一下Web开发中的浏览器缓存。这个在实际开发环境中往往也会被问到,或者使用到。如何去准确认清楚缓存的概念,是前端必须要去学习的。
正文
浏览器的缓存问题,主要指的是http的缓存——即协议层。而h5新增的storage和数据库缓存,那是应用层缓存,并不被计入本篇的分析内容里面。下面我们正式开始来进行缓存的分析。
协议层的缓存,其实,可以被分成强制缓存和对比缓存(又名协商缓存)。
强制缓存
首先,我们先来看一张强制缓存时的时序图,来了解一下强制缓存在不同情况下的请求模式:
从图中,我们不难看出,只有当缓存失效时,才会去服务器获取最新资源的方式,就是强制缓存。而在协议层的字段中,可以造成强制缓存的字段有两个Expires和Cache-Control。
1.0的时候见到我——Expires
最早使用的是Expires字段,该字段表示缓存到期时间,即有效时间+当时服务器的时间,然后将这个时间设置在header中返回给浏览器。因此,该时间是一个绝对时间,举例说明:
Expires: Thu, 10 Nov 2017 08:45:11 GMT
在响应消息头中,设置这个字段之后,就可以告诉浏览器,在未过期之前不需要再次请求。
但是,这个字段设置时有缺点:
由于是绝对时间,用户可能会将客户端本地的时间进行修改,而导致浏览器判断缓存失效,重新请求该资源,同时,还导致客户端与服务端的时间不一致,致使缓存失效。
1.1的时候我来了——Cache-Control
已知Expires的缺点之后,在HTTP/1.1中,增加了一个字段Cache-Control,该字段表示资源缓存的最大有效时间,在该时间内,客户端不需要向服务器发送请求
这两者的区别就是前者是绝对时间,而后者是相对时间。我们不妨举个例子来说明一下:
Cache-Control: max-age=2592000
下面列举一下Cache-Control的字段可以带的值:
- max-age:即最大有效时间,在上面的例子中我们可以看到
- no-cache:表示没有缓存,即告诉浏览器该资源并没有设置缓存,有协商缓存的时候走协商缓存
- s-maxage:同max-age,但是仅用于共享缓存,如CDN缓存
- public:多用户共享缓存,默认设置,可以被所有用户缓存,包括终端用户和cdn等中间代理服务器。
- private:不能够多用户共享,HTTP认证之后,字段会自动转换成private,只能被终端用户的浏览器缓存,不允许cdn等中继缓存服务器对其缓存。
- no-store:直接禁止浏览器缓存数据,每次用户都需要从服务器请求完整的资源。
总结一下,自从http1.1开始,Expires逐渐被Cache-Control取代。Cache-Control是一个相对时间,即使客户端时间发生改变,相对时间也不会随之改变,这样可以保持服务器和客户端的时间一致性。而且Cache-Control的可配置性比较强大。
同样cache-control也有强制缓存的缺点,如果服务器资源已经更新,浏览器缓存还没有失效,浏览器没有办法获取最新的代码。
对比缓存
扯完强制缓存,我们来看看对比缓存。在解释这个之前,是否可以先猜想一下,强制缓存是,缓存在未过有效期时,不需要请求资源。那么,对比缓存的原理又该如何呢?
对比缓存的过程是,先从缓存中获取对应的数据标识,然后向服务器发送请求,确认数据是否更新,如果更新,则返回新数据和新缓存;反之,则返回304状态码,告知客户端缓存未更新,可继续使用。
这正好弥补了一些强制缓存的缺陷。对比缓存主要应用于一些时常需要动态更新的资源文件。
对比缓存在协议里的字段是Last-Modified和If-Modified-Since。
别人的好伙伴——Last-Modified
Last-Modified:服务器告知客户端,资源最后一次被修改的时间,例如
Last-Modified: Thu, 10 Nov 2015 08:45:11 GMT
If-Modified-Since:再次请求时,请求头中带有该字段,服务器会将If-Modified-Since的值与Last-Modified字段进行对比,如果相等,则表示未修改,响应304;反之,则表示修改了,响应200状态码,返回数据。
这个字段可以和Cache-Control配合使用。
但是他还是有一定缺陷的:
- 如果资源更新的速度是秒以下单位,那么该缓存是不能被使用的,因为它的时间单位最低是秒。
- 如果文件是通过服务器动态生成的,那么该方法的更新时间永远是生成的时间,尽管文件可能没有变化,所以起不到缓存的作用。
我来完善它——Etag
由于Last-modified还是存在缺陷的,尽管大多数情况下,会使用它,但当遇到我们上面所说的场景时,我们可能就需要了解一下,我们另一个小伙伴了——Etag。
Etag存储的是文件的特殊标识(一般都是hash生成的),服务器存储着文件的Etag字段,可以在与每次客户端传送If-no-match的字段进行比较,如果相等,则表示未修改,响应304;反之,则表示已修改,响应200状态码,返回数据。
最后,通过一张原理图,我们来加深一下记忆:
至此为止,两种缓存类型的缓存方式已经阐述完成了,不知你是否已经心中已经有个大致的印象,当别人问起时,你可以对答如流。希望我们一同进步吧,fighting。
浏览器行为引起的不同
最后,我们来聊聊浏览器行为会引起缓存的变化吧。
下面说一下浏览器的行为会产生怎样的请求:
- 刷新网页 => 如果缓存没有失效,浏览器会直接使用缓存;反之,则向服务器请求数据
- 手动刷新(F5) => 浏览器会认为缓存失效,在请求服务器时加上Cache-Control: max-age=0字段,然后询问服务器数据是否更新(强制缓存失效,协商缓存有效)。
- 强制刷新(Ctrl + F5) => 浏览器会直接忽略缓存,在请求服务器时加上Cache-Control: no-cache字段,然后重新向服务器拉取文件(强制缓存与协商缓存都失效)。
移动端的缓存处理
在PC端或许这样子的缓存机制就已经足够了,因为PC端不需要为网络的问题担心。
但是,移动端却不行,任何一个网络请求的增加,对于移动端的加载消耗时间都是比较大的(谁叫移动端的网太差呢,3G、2G)。那么,上述的缓存有什么问题呢?其实,强制缓存是没有太大问题的,因为只要缓存不到期,是不会想服务器发送请求的;但是如果是对比缓存的情况下,304的问题就比较巨大,因为它会造成无用的请求。每次在使用缓存前,都会向服务器发送请求确认,导致网络的延时。
一次完美的缓存必须保证两点:
- 数据缓存之后,尽量减少服务器的请求
- 如果资源更新的话,必须使得客户端的资源一起更新。
所以,一般我们会运用的方式是:
在资源文件后面加上表示,如config.f1ec3.js、config.v1.js之类的,然后给资源设置较长的缓存时间,如一年
Cache-Control: max-age=31536000
这样子,就不会造成304的回包现象。
然后一旦资源发生更新时,我们可以改变资源后面的标识符,实现静态资源非覆盖式更新。
缓存的优先级
几种缓存策略可以同时存在
1、对比缓存优先级 > 强制缓存优先级
2、对比缓存:Etag优先级 > Last-Modefied优先级
3、强制缓存:Cache-Control优先级 > Expires优先级
还有一种缓存program,优先级大于cache-control,不过几乎不用。
总结
本篇大致分析了浏览器缓存部分的分类情况,以及细化分析。主要可分为:
-
强制缓存
- Expires字段
- Cache-Control字段
-
对比缓存
- Last-Modefied字段
- Etag标识
- 浏览器行为引起的缓存变化
- 移动端的缓存策略
扩展:浏览器对文件的缓存
1、server cache:浏览器本地启动一个server work,决定缓存哪些文件以及缓存机制,这个是一个竞态机制,获取缓存的同时请求资源,哪个先返回用哪个,请求的资源(如果有修改)会被缓存,下一次生效。
2、memory cache:内存缓存
3、dist cache:硬盘缓存
4、push cache:http/2的推送资源
参考文献: