web开发中的缓存问题的研究(一)
web开发中的缓存问题的研究(二)
web开发中的缓存问题的研究(三)
从图4.16中还可以看到,其“检查所存网页的较新版本”功能项的设置值有4个选项,只要先单击“设置”对话框标题栏中的问号按钮,然后再单击相应的选项,就可以看到每个选项的作用和意义:
- “每次访问此页时检查”选项表示浏览器每次访问一个页面时,不管浏览器是否缓存过此页面,都要向服务器发出访问请求。这种设置的优点是实时性很强,肯定能够访问到网页的最新内容,但是如果网页内容很少更新,这种设置的访问效率就比较低了。
- “每次启动Internet Explorer时检查”选项表示在浏览器的每次启动运行期间,在第一次访问一个页面时,不管浏览器是否缓存过此页面,都要向服务器发出访问请求,但是在浏览器的本次启动运行期间对该页面的后续访问,浏览器将不再向服务器发出访问请求,而是直接使用缓存中的内容。这种设置具有较高的访问效率,同时也兼顾了较好的实时性,它可以保证每次启动浏览器后看到的都是最新的网页内容。
- “自动”选项与“每次启动Internet Explorer时检查”选项的功能相似,只是对图像的访问有所不同,如果随着时间的推移,浏览器发现网页上的图像更新并不频繁,这样,即使浏览器在对某个已缓存的图像执行本次启动运行以来的第一次访问时,它也不一定会向服务器发出访问请求,而是干脆直接使用缓存中的内容。“自动”选项是浏览器的默认设置,所以,几乎所有人的浏览器都是按照这种方式工作的,这个选项的作用和意义应该成为读者熟悉的重点。
- “不检查”选项表示浏览器不管在什么情况下访问一个页面时,只要能够在本地找到此页面的缓存信息,浏览器就不会向服务器发出访问请求,而是直接使用缓存的内容。这种设置的优点是访问效率很高,但是如果服务器端的网页内容更新后,浏览器看到的内容很可能是过期的内容。
在浏览器的“检查所存网页的较新版本”的功能项采用默认的“自动”设置项的情况下,如果浏览器刚刚访问过一个网页,服务器端就更新了这个网页的内容,当浏览在关闭前又重新访问这个页面时,用户看到的将不是更新的网页内容,而是过期的网页内容。为了提高浏览效率,在访问静态的网页内容时,这么一点小概率的过期信息还是应该允许的,并且这些过期信息也不会造成什么不好的后果,就像你偶尔有一次看到了前一天发生的新闻,而不是当天的新闻,这又有什么问题呢?可是,如果浏览器访问的是一个动态网页,这本来就要求浏览器在其整个运行期间的每次访问都能看到最新的内容,例如,销售一件商品后再回到商品库存的显示页面时,看到的就应该是更新的库存数据,而不应该是先前看到的内容。仅仅根据被访问页面的资源名称,浏览器是无法知道商品库存的显示页面是属于动态内容,还是属于静态内容。对于这种情况,浏览器将根据响应消息中是否包含Last-Modified头字段来进行处理,如果响应消息中没有包含Last-Modified头字段,它将在每次访问此页面时都向服务器发出访问请求,否则,它仅在每次启动运行后的第一次访问此页面时才向服务器发出访问请求,而在启动运行期间对此页面的后续访问都不再向服务器发出访问请求。
在第2章中曾经讲解过,响应消息中的Last-Modified头字段可用于指定响应内容的最后更新时间,当客户机缓存此文档内容后,它在以后的请求消息中将根据Last-Modified头字段指定的时间来生成If-Modified-Since请求头字段,以指出缓存文档的最后更新时间。只有文档的修改时间比If-Modified-Since请求头指定的时间新时,服务器才会返回文档内容。如果自从If-Modified-Since指定的时间以来,网页内容没有发生修改,服务器将返回一个304(Not Modified)状态码来表示浏览器缓存的版本是最新的,而不会向浏览器返回文档内容,浏览器则继续使用以前缓存的内容。通过这种方式,可以在一定程度上减少浏览器与服务器之间的通信数据量,从而提高了通信效率。
HttpServlet类为If-Modified-Since请求头和Last-Modified头字段的这种应用提供了处理机制,当继承了HttpServlet类的Servlet程序接收到一个GET方式的访问请求时,HttpServlet中重载的service方法在调用doGet方法之前,它还将调用getLastModified方法,并根据getLastModified方法的返回值来决定是否调用doGet方法和在响应消息中是否生成Last-Modified头字段,具体规则如下:
- 当getLastModified方法返回一个负数时,不管请求消息中的情况怎样,service方法都将直接调用doGet方法来生成响应内容,这正是HTTPServlet类中定义的getLastModified方法的行为;
- 当getLastModified方法返回一个正数,且请求消息中没有包含If-Modified-Since请求头时(这往往出现在第对某个资源的第一次访问时),或者请求消息中包含的If-Modified-Since请求头中的时间值比getLastModified方法返回的时间值旧时,service方法将根据getLastModified方法的返回值生成一个Last-Modified头字段,然后调用doGet方法生成响应内容;
- 当getLastModified方法返回一个正数时,且请求消息中包含的If-Modified-Since请求头中的时间值比getLastModified方法返回的时间值新或者与之相同时,service方法将不调用doGet方法,而是向浏览器返回一个304(Not Modified)状态码表示浏览器可以使用其以前缓存的内容。
(1)编写一个名为CacheServlet的Servlet程序,在其doGet方法中向浏览器和Tomcat的命令行窗口中都打印出当前的时间值,getLastModified方法也是向Tomcat的命令行窗口中打印出当前的时间值和返回当前时间值,这里先将getLastModified方法注释掉,如例程4-9所示。
例程4-9 CacheServlet.java
import java.io.*;
import javax.servlet.*;
import javax.servlet.http.*;
public class CacheServlet extends HttpServlet
{
public void doGet(HttpServletRequest request,
HttpServletResponse response) throws ServletException, IOException
{
PrintWriter out = response.getWriter();
long now = System.currentTimeMillis();
out.println("doGet:" + now);
System.out.println("doGet:" + now);
}
/*protected long getLastModified(HttpServletRequest req)
{
long now = System.currentTimeMillis();
System.out.println("getLastModified:" + now);
return now;
}*/
}
编译CacheServlet.java文件,确保编译后生成的class文件放置进了d:/myweb/WEB-INF/classes目录中。
(2)在d:/myweb目录中编写一个名称为CacheTest.html的网页文件,如例程4-10所示。
例程4-10 CacheTest.html
<a href="servlet/CacheServlet">缓存测试</a>
(3)为了便于查看浏览器如何生成缓存内容,最好是先删除掉Internet临时文件夹中保存的所有缓存内容。单击IE浏览器的“工具”“Internet选项”菜单,打开如图4.16所示的“Internet选项”对话框,接着再单击“常规”选项卡中的“Internet临时文件”栏中的“删除文件”按钮,这就删除了Internet临时文件夹中保存的所有缓存内容。单击“常规”选项卡中的“Internet临时文件”栏中的“设置”按钮,在打开的“设置”对话框框中单击“Internet临时文件夹”栏中的“查看文件”按钮,打开如图4.17所示的Internet临时文件夹,可以看到其中已经不再有任何缓存的文件。另外,在“设置”对话框框中还需要将“检查所存网页的较新版本”的功能项恢复为默认的“自动”。
在浏览器地址栏中输入如下地址:
http://localhost:8080/it315/CacheTest.html
在浏览器窗口中显示的结果页面中,单击“缓存测试”超链接访问CacheServlet。再次打开Internet临时文件夹,这时可以看到其中生成了刚才访问过的CacheTest.html和CacheServlet这两个页面的缓存文件,如图4.18所示。选中其中的CacheServlet缓存文件,从Windows资源管理器窗口中显示出的摘要信息中可以看到,CacheServlet缓存文件中记录的上次修改时间为“无”。
图4.18
(4)在命令行窗口中执行telnet 127.0.0.1 8080命令,连接上Tomcat WEB服务器后,接着在telnet程序命令窗口中,输入如下内容:
GET /it315/servlet/CacheServlet HTTP/1.1<回车>
Host:<空格><回车>
<回车>
telnet窗口中显示出的结果如图4.19所示。
图4.19
从图4.19中可以看到,CacheServlet返回的响应消息中没有Last-Modified头字段,这正是图4.18中显示的CacheServlet缓存文件的上次修改时间为“无”的原因。