代码改变世界

Java EE启示录

2010-02-03 02:24  hyddd  阅读(11564)  评论(19编辑  收藏  举报

前言

    最近的这段时间一直在学习Java EE,刚刚完成了从0到1的蜕变,所以顺便整理一下我所了解到的Java EE,给刚入门学习的新人一些头绪,而所谓“启示录”,就是这个意思。

一.Java EE是什么?

   Java EE(Java Enterprise Edition)是一种企业级应用的软件架构,同时是一种思想,一套规范。

二.Java EE的发展史

histroy

    Java Enterprise Edition的发展不知不觉已经12年了,不知道大家有没留意,一开始,Java Enterprise Edition简称“J2EE”,直到版本5才改名为Java EE,而现在最新的版本则是Java EE 6。

    到这里,或许有人会问,为什么会有这么多套Java EE规范?这些版本的差别是什么?

1.J2EE1.2的出现,主要是将之前各个单独的规范绑定到一起。

2.J2EE1.3,则是继续完善J2EE体系结构。

3.J2EE1.4,主要是加入了一个重要主题:Web Service

4.而Java EE 5,主题则是“简化”,简化之前复杂的J2EE思想,改善开发体验。

三.Java EE到底要解决什么问题?

1.Java EE解决什么问题?

    从Java EE发展背景看,它与“分布式应用”以及“互联网应用”的关系密不可分,而这两者也正是Java EE要解决的问题!

    其实,分布式应用随着90年代互联网的兴起逐渐开始普及。在90年代中,各种分布式应用标准逐渐诞生,如:OMG的CORBA,MS的DCOM等,而Sun在推出Java的RMI(Remote Method Invocation)后,便以RMI作为通信基础构建了Java EE。我认为,Java EE最核心要解决的问题就是“分布式应用”。而在接下来的竞争中,Java EE也不负所托,逐渐取代了CORBA,DCOM的地位。

2.分布式应用与RPC

    RPC(Remote Procedure Call),在聊到分布式应用时很多人会第一时间想到它。所谓RPC,就是远程调用一个服务,但效果和本地调用一样。在最初的时候,RPC很类似C语言的函数调用,但随着编程语言和技术的发展,特别是面向对象和面向组件技术的广泛应用,便出现了“远程对象/方法调用”。所谓“远程对象/方法调用”其实就是把调用远程对象和本地对象的区别隐藏起来,让调用者可以像使用本地对象那样调用远程对象。从本质上说,最初的RPC和后来的“远程对象/方法调用”稍有不同,在“远程对象/方法调用”中,被调的服务还需要考虑如:对象生命周期管理,事务处理……这些问题。但笼统地说,最初的RPC和“远程对象/方法调用”都称为:RPC,所以之前提到的如:DCOM,CORBA,JAVA的RMI,.NET的Remoting都称为RPC。而我认为,RPC的本质就是:应用协议 + 传输协议。而各种不同的RPC实现之间的区别亦在此。

    而所谓的“分布式应用”,实际上可以说是用RPC方式,把各个分布在不同机器的应用模块联合成一个系统。可以说RPC是“分布式应用”的基础,所以就有“以RMI作为通信基础构建了Java EE”这一说了:>

 

四.Java EE体系结构

    这里,我打算从分析“企业级应用”入手,并藉此逐步建立整个Java EE体系。

1.概述Java EE体系结构

     为了有印象,我们先来个最简单Java EE架构图看看:

arch_2

从上图看到,Java EE一般分为4层:

(1)客户端

(2)web层

(3)业务逻辑层

(4)企业信息层(EIS:Enterprise Information System)

    呵呵,不要以为Java EE只是描述服务端规范,实际上,它还是包含了一些客户端相关东东,比如:Applet...不过,Java EE的重点还是在服务端这方面,而本文重点也是介绍Java EE在服务端这方面的内容。

2.“企业级应用”分析

(1)分布式应用

    首先从总的来看,一个“企业级应用”代表着,这个系统肯定是“非常大型的”,这么大型的系统,这么多的应用,是不可能把应用都部署在一台机器上的,所以“分布式应用”这个需求便顺理成章地出现。理想的“企业级应用”中,各种功能模块应该分布在不同的机器上,在需要某功能的时候,我们可以动态地进行调用。

(2)系统分层

    企业应用中,业务的功能会非常复杂。此时,模块间的解耦以及系统的分层开始显得重要,解耦与分层会使得系统结构清晰,并且健壮。而传统的分层模式是一般是:接入层,逻辑层,数据层。

(3)异步

    设计分布式应用时,你遇到的第一个问题就是:等待…..在企业级应用中,业务的处理时复杂的。如果把子模块部署到不同机器后,要处理一个业务,很可能需要到多台机器上进行调用;另外,子模块的运算也需要一定的时间,此时,“等待”就出现了。由于你无法预计这个复杂的业务什么时候才能处理完,所以,“异步”这个概念也顺理成章地被引入。(其实,这也体现了软件设计中“快慢分离”的原则)

(4)事务,安全

    关于事务的重要性这里就不多说了。

    而安全,一般指对某个模块的授权,身份验证等等,在企业级应用中,安全绝对是重要的一块。

(5)Java EE平台与其他已有资源、服务、系统的整合

    在Java EE出来之前,很多公司很可能已经建立了比较完善的企业信息系统(EIS),显然,和这些已有的系统整合,在企业级应用中显得尤为重要。

3.Java EE体系结构详述

    OK,现在让我们来逐步了解,Java EE每个部件的作用吧。

(1)Servlet,JSP

    JSP,Servlet同属“web层”,并都属于“动态网页技术”。所谓“动态网页技术”和传统的“静态网页技术”不一样,传统的“静态网页技术”说白就是把做好的html文件直接上传到服务器并直接供客户浏览,而“动态网页技术”则是每次都根据用户请求,动态生成响应页面并返回。“动态网页技术”的好处不言自明,无论从灵活性,数据保密性…等方面说都是“静态网页”所无法媲美的。但“动态网页技术”也是有缺点的,就是相对较慢,现在的解决方案一般是:把“动态网页”中相对固定的部分做缓存,即所谓“静态页面”。(额.…..“静态网页”和“静态页面”本质上没什么区别,都是静态页面,但思想上却有很大区别。而现在的程序员一般会对“静态”这个词赋予一个新的含义:“缓存”)

【1】Servlet

    Servlet实际上就是按照Servlet规范编写的一个java类,与传统的命令行启动的Java应用程序不同,Servlet位于Web服务器内部,并由Web服务器加载并调用。

【2】JSP

    JSP全称是:JavaServer Page。这项技术的推出目的其实很简单,为了弥补Servlet一个很重要的缺陷:“麻烦”。

    先看看Servlet到底什么地方让人觉得麻烦,下面是一个Servlet处理Get请求例子:

public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
    System.out.println("处理GET请求ing......");
    response.setContentType("text/html;charset=GB2312");
    PrintWriter out = response.getWriter();
    out.println("<HTML>");  // 静态内容
    out.println("<BODY>");  // 静态内容
    out.println("Hyddd's Servlet Demo " + new Date().toString());  // 动态内容
    out.println("</BODY>"); // 静态内容 
    out.println("</HTML>"); // 静态内容
}

从上面这个例子,相信大家已经发现问题了,Servlet主要是把动态内容混合到静态内容中以产生html,这导致Servlet代码中将会输出大量的html标识,哇,地狱,简直就是地狱,同时,这也非常不利于程序员和UI美工的配合(不要指望美工人员会和你一起写html标识)。为了解决这些问题,JSP诞生了。

    JSP是一种建立在Servlet规范之上的动态网页技术,通常做法是:在html页面中嵌入JSP标记和脚本代码。JSP把静态内容和动态内容的分离,实现了内容和表示的分离。

【3】Servlet与JSP的关系

 

    上图描述得比较清楚了,JSP文件先是转换为Servlet类,然后编译,并启动Servlet实例响应客户端请求。为什么说JSP是建立在Servlet上的动态网页技术,从这里可以看出来。

    Web层主要就是JSP以及Sevlet这两项技术。

arch_2_1

(2)EJB(Enterprise JavaBean)

    之前说过,分布式应用是Java EE一个基础的需求,额……那在不同机器上的“分布式”的应用到底会以一个什么样的形态出现呢?答案就是:EJB。EJB属于业务逻辑层上的东东。

    所谓Bean,其实是“组件”的意思。EJB可以让你像搭积木一样,通过本地/分布式调用组装不同应用到大型应用中,使你能集中精力来处理企业的业务逻辑,而像事务、网络、安全等等这些底层服务则统统留给EJB服务器开发商来解决。

    利用基于组件的开发,可以把代码重用上升到一个新的高度。利用面向对象开发,重用的是类,而基于组件时,重用的则是更大的功能块。

    【1】EJB vs Java Bean

    我个人认为,Java Bean相当于是数据存储类(不涉及具体业务逻辑),专门用来存数数据,提供getter,setter方法,并且在JVM上可直接运行。EJB则相当于一个功能模块,提供业务逻辑的服务,而运行时,则需要EJB容器的帮助。

    EJB是业务逻辑层最重要的技术哦!

arch_2_2

(3)Container(容器)

    Container这个概念经常在Java EE中出现,所谓Container,在Java EE 5 Tutorial中有这样一段解释:“Containers are the interface between a component and the low-level platform-specific functionality that supports the component.”,而Container的作用,我个人的认为是:为“应用程序”提供一个环境,使其可以不必须关注某些问题,如:系统环境变量,事务,生命周期…….通俗地说,Container就像“秘书”,帮“应用程序”管理着各种杂乱的问题,为其提供运行时支持

    其中,Java EE里有两个很重要的容器:Web容器EJB容器

【1】Web容器

    Web容器是用于托管“Web应用程序”的J2EE容器,主要负责管理“Servlet”和“JSP”运行。

WebContainer

【2】Servlet容器

    其实,上图中的Servlet指的就是Servlet容器。而Servlet的设计初衷,实际是基于线程池的更好的线程容器,见下图:

servletContainer 

【3】EJB容器

     EJB容器主要负责管理“EJB”的运行。

 

    而EJB的设计实际上是基于对象池的思想,你可以认为EJB=对象池+远程对象池。见下图:

ejbContainer

【4】Servlet与EJB

    其实,根据Servlet和EJB的设计初衷,我们已经可以看出Java EE对两者角色的定义了。线程的本质决定了Servlet只适合一些比较简单的轻量级应用;一旦问题复杂了,最好的就是使用EJB。

(4)RMI

    RMI全称:Java Remote Method Invocation,就是利用Java对象序列化的机制,实现远程类对象的实例化以及调用的方法。

    RMI在Java EE中的主要是负责解决通信问题,特别是不同的EJB容器之间的通信。大家知道,在分布式应用中,各个功能模块(EJB)之间通信需要有统一的RPC协议,否则没法通信,而RMI就是负责这方面的工作。

【1】RMI 与 CORB

    可以说,RMI就是CORBA的Java版实现。

【2】再谈“远程调用”

    现在主流的远程调用方式,不管是com/com+,soap,webservice,rmi,.net remoting,说白了都一样的,就是序列化,网络传输,反序列化

    序列化方式:同种runtime的,可以native的二进制序列化,序列化的效率高。文本的序列化(xml/json/自定义格式)的方式,可以跨平台和语言,一般基于中间类型。但此序列化方式的效率低,数据量也偏大。

    网络传输:则可以使socket/http或是自定义协议的。 socket数据冗余最小,效率最高。RMI其实是socket上的自定义协议。 http要走http的报文,文本的方式最合适,实现最简单,开发和部署方便。

 

(5)JMS

    JMS:Java Message Service。JMS提供一种消息机制,主要作用是提供异步通信的支持,是Java EE的重要基础模块。值得注意,异步通信,一般都采用消息机制,这种情况在Windows中最常见。

(6)JTA

    JTA:Java Transaction API,主要提供事务服务和分布式事务管理功能,保证分布式事务的一致性,是Java EE的重要的基础模块。

(7)JAAS

    JAAS:Java Authentication Authorization Service(Java认证于授权服务),提供了对Java组件的安全保护,如哪些Servelt,JSP能被哪些用户访问,哪些EJB能被调用等。但需要注意的是,JAAS只提供了对JAVAEE组件的保护,对于企业应用业务的权限,它是做不到的。

(8)Connector

    Connector主要作用就是把其他已有的资源、服务、系统整合到Java EE系统中。不同的服务提供商和Java EE平台会定义不同的协议,而Connector就是指这些协议的实现。

    至此为止,Java EE的核心模块介绍完毕,让我们来看看J2EE 1.3的架构图(当时的J2EE架构还是比较简单的):

JAVAEE1.3

4.J2EE 1.4 以及 Java EE 5体系结构

(1)J2EE 1.4 体系结构

JAVAEE1.4

    J2EE 1.4加入了一个重要的主题:“Web Service”,包括:JAX-RPC,SAAJ,Web Srvcs,JAXR都属于这一块的东西。

(2)Java EE 5体系结构

javaee5

    关于Java EE 5这里就不详细介绍了:>,大家有兴趣可以参考《Java EE Tutorial 5》。

后记

    这篇文章写了我3天,同时也翻了N多资料,希望本文确实对各位初学者有所帮助,同时本文包含很多个人观点,如有错误敬请指出:>

    关于Java EE 5,如果后续有时间我会继续整理。

重要参考资料

【1】《JAVA EE 5 的发展史

【2】《Java程序员 上班那点儿事

【3】《Java EE Tutorial 5

【4】《J2EE到底是什么?