Java Web应用开发中的一些概念
最近在学习Java Web,发现Java Web的概念很多,而且各个概念之间的关系也挺复杂,本篇博客把这些关系总结于此,主要参考的博客附在文章末尾。
概念
服务器
服务器,硬件角度上说就是一台高性能的计算机。我们通常指的服务器其实应该是装有能够处理具体请求事务的服务器软件的计算机。比如最常见的www服务器、mail服务器、计费服务器、ftp服务器等等。很多时候人们常把诸如Tomcat、IIS、Weblogic 也称之为web服务器,其实这些只是用于开发、集成、部署和管理Web应用、网络应用和数据库应用的应用服务器软件。我们把遵守J2EE规范中的WEBAPPLICATION标准的WEB服务器就叫做J2EE中的WEB容器。
Web容器
所有的程序运行都需要有一个必要的运行环境。这个环境可以是软件,也可以是硬件,或者是软件和硬件的结合。比如说Windows操作系统需要运行在硬件基础上;Office软件需要运行在操作系统上。程序与运行环境之间会有一定的数据交换,比如操作系统会将运行指令传递给硬件,硬件也会将指令运行结果传递给操作系统。
Java Web程序也需要一个运行环境才能够执行。这种运行Java Web程序的环境被称为Web容器,Java Web程序与Web容器之间存在数据交互。目前主要存在两种类型的Java Web容器:一种是独立的Java Web容器,在这种容器里面只能运行Web程序,这种容器一般也叫做Web服务器,如Tomcat等;另一种是与其他Java EE容器混合在一起的Web容器,Web容器负责运行Web程序,其他容器负责运行EJB等程序,如WebLogic等。
当用户通过浏览器等Web客户端软件向服务器发出一个请求之后,首先接收到这个请求的是Web容器,Web容器会将请求信息封装到一个HttpServletRequest类型的Java对象中,并将对象传递给Java Web程序。对于每个请求,Web容器还会创建一个HttpServletResponse类型对象,该对象的作用是用来保存需要返回到浏览器等客户端的内容。
Java Web程序可以从HttpServletRequest提取用户发出的请求信息,进行适当的处理之后,将处理结果放置到HttpServletResponse中,然或由Web容器解析HttpServletResponse对象内容,并将解析结果以浏览器能够识别的HTML等格式返回给浏览器等客户端。在这个过程中,HttpServletRequest和HttpServletResponse就如同两条渡船,负责在Web容器和Java Web程序之间传递信息。需要注意的是,这两个对象仅存在于Web容器和Java Web程序当中,与浏览器没有关系。下图是这个过程的示意图:
Web组件
Web组件(Web Component)是构成Web应用、能够对来自浏览器等客户端请求做出回应的基本单元。在Java Web应用中,所提供的Web组件有Servlet、JavaServer Pages(JSP)、JavaServer Faces(JSF)等。另外还可以使用其他类型Web应用同样使用的内容,比如HTML文件、静态图片等。事实上Java Web只提供了一种Web组件——Servlet,而JSP、JSF等都是基于Servlet的衍生技术。Servlet实质就是一个有特殊继承关系要求的Java类,理解Servlet就基本上完全理解Java Web技术了。
Web应用
Web应用可以认为是Web程序的另一个名称。定义就是运行在Web容器当中的,能够完成完整功能的应用程序。Java Web应用由一系列编译之后的Java类、静态图片、静态HTML文件、配置文件等构成。通过Java Web应用可以就收用户的输入和请求,并对请求信息进行加工处理、访问数据库、对用户的请求给出回应。
开发Java Web应用程序处理需要遵守Web应用的一些特殊规范要求以外,与开发其他类型的应用程序并没有本质区别。目前Web应用主要有两种类型:一种是以展示为目的的Web应用,这种应用会以HTML等标记文本或者浏览器所能识别的媒体格式最为请求返回内容,用户可以通过浏览器等客户端操作这类应用。另一类是以服务为目的的Web应用,这类应用不提供图形操作界面,只提供方法调用结构,比如Web服务,该类应用一般只能被其他应用程序调用和访问。
Web模块
在Java EE技术体系中,除了Java Web以外,还包括EJB等其他技术。每个技术体系会运行在各自的容器当中,不同的部分组合在一起构成完整的Java EE应用,每个部分根据自己的特点被称为Java Web模块或者EJB模块。之所以把他们称为模块,是因为希望Java EE应用不同部分能像积木一样组合出更大、更复杂的应用出来,并且每个部分保证其独立性。不同的模块都有自己特定的目录结构要求。Java Web模块的目录结构要求如下。
- 应用文档根目录。改目录是Java Web模块的最上层目录,组成Web模块的所有Web组件以及配置文件等都包含在该目录或者子目录下。在改目录下可以直接存放HTML文件,图片文件等。
- WEB-INF目录。改目录位于应用文档根目录下,用来保存那些不希望被浏览器等客户端访问的文件,比如发布描述文件、编译之后的类文件。因为这些文件是由由Web容器进行解释或者执行的。浏览器不可以直接看到这些文件,只能看到这些文件的执行结果。
- web.xml文件。该文件位于WEB-INF目录下,是Web应用的部署描述文件,用来与定义Web应用运行相关的信息,比如执行逻辑,Servlet等Web组件的访问路径等。改文件的格式必须符合所使用的Servlet版本的规格要求。
- classes目录。该目录位于WEB-INF目录下,用来保存编译之后的Java类文件,比如Servlet、辅助类、其他业务处理类等。
- tags目录。该目录位于WEB-INF目录下,用来保存那些标签库的标签描述文件。
- lib目录。该目录位于WEB-INF目录下,用来保存Web应用运行所依赖的,经过打包之后的Java类文件。打包格式一般是.jar格式。
对于Java Web模块目录中WEB-INF、web.xml、classes、tags、lib这些内容以外,用户可以根据自己的需要在Web应用文档根目录下创建其他目录,比如可以为图片、不同用途的HTML或者JSP单独创建目录;还可以为不用的Java类在classes下创建包目录。如果在你的Web应用中没有使用到Servlet、过滤器、监听器等Java Web组件,可以没有web.xml文件;如果没有使用到标签,则可以没有tags目录。
Web模块的发布工作,可以直接以目录的形式发布,也可以打包成jar格式文件进行发布。因为用途和内容的特殊性,打包文件的扩展名会采用.war而不是.jar。另外如果不是发布到独立的Web服务器上,而是发布到与其他Java EE一起使用的企业应用服务器上,还需要编写一个与企业应用服务器相关的配置文件,这个文件对于不同的企业应用服务器也不同,比如发布到glassfish服务器上,需要编写的文件时sun-web.xml。
一些概念的对比
Java Servlet vs Java Server Page
尽管JSP在本质上就是Servlet,JSP编译后就是一个“类servlet”,但是两者的创建方式不一样。
- Servlet完全是Java程序代码构成,擅长于流程控制和事务处理,而通过Servlet来生成动态网页很不直观;对于静态的html标签,Servlet都必须使用页面输出流逐行输出
- JSP由html代码和JSP标签构成可以方便地编写动态网页因此在实际应用中采用Servlet来控制业务流程,而采用JSP来生成动态页面。在struts框架中,jsp位于MVC设计模式的视图层,而servlet位于控制层。
- Servlet中没有内置对象。
总之,JSP是Servlet的一种简化,使用JSP只需要完成程序员需要输出到客户端的内容,至于JSP中的Java脚本如果镶嵌到一个类中,由JSP容器完成,而Servlet则是个完整的java类,这个类的service方法用于生成对客户端的响应。
Tomcat与Servlet
Servlet(小服务程序)是一个与协议无关的、跨平台的Web组件,它基于Java技术开发,由Servlet容器所管理。Servlet运行在服务器端,可以动态地扩展服务器的功能,并采用“请求一响应”模式提供Web服务。 Servlet的主要功能是交互式地浏览和修改数据,生成动态Web内容。
当初在Apache开发时还未出现Servlet的概念,所以Apache不能内置支持Servlet。实
际上,除了Apache,其他许多Web服务器软件都不能直接支持Servlet。为了支持Servlet,
通常要单独开发程序,这种程序一般称为Web容器,它在Servlet的生命周期内包容和管理Servlet,是一个实时运行的外壳程序。运行时由Web服务器软件处理一般请求,并把Servlet调用传递给容器来处理。Tomcat就是满足这种需要的JSP/Servlet引擎,是Sun公司的JSP/Servlet的官方实现。Tomcat服务器接收客户端请求并作出响应的完整过程下图所示。
Tomcat与Web服务器
Tomcat是提供一个支持Servlet和JSP运行的容器。Servlet和JSP能根据实时需要,产生动态网页内容。而对于Web服务器来说,Apache仅仅支持静态网页,对于支持动态网页就会显得无能为力; Tomcat则既能为动态网页服务,同时也能为静态网页提供支持。尽管它没有通常的Web服务器快、功能也不如Web服务器丰富,但是Tomcat逐渐为支持静态内容不断扩充。大多数的Web服务器都是用底层语言编写如C,利用了相应平台的特征,因此用纯Java编写的Tomcat执行速度不可能与它们相提并论。
一般来说,大的站点都是将Tomcat与Apache的结合,Apache负责接受所有来自客户端的HTTP请求,然后将Servlets和JSP的请求转发给Tomcat来处理。Tomcat完成处理后,将响应传回给Apache,最后Apache将响应返回给客户端。