JAVA基础之XML相关

个人理解:

  知晓XML与HTML的不同,知道其的自由性和约束的方式(规范)!数据按Schema约束写到XML里,然后通过dom4j解析出所有的元素,再用反射创建对象接着调出其所有的方法!!!特别要熟练掌握反射的3种创建对象的方法!

一、模拟Servlet执行

了解WEB服务器就是另一台计算机。

  为了灵活实现的不同路径(/hello)执行不同的资源( HeIIoMyServlet)我们需要使用XML进行配置;为了限定XML内容,我们需要使用xml约束(DTD或schema);为了获得xml的内容,我们需要使用dom4j进行解析。然后可以通过反射进行创建对象,获取其中的方法。

二、XML介绍:

  XML个称为Extensible Markup Language,意思是可扩展的标记语言。XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。

     W3C在1998年2月发布1.0版本,2004年2月义发布1.1版本,但因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在2004年2月W3C又发布了1.0版本的第三版。我们要学习的还是1.0版本!!!

三、XML语法:

1、文档声明:

<?xml version="1.0" encoding="UTF-8"?>

①、文档声明必须为<?xml开头,以?>结束;

②、文档声明必须从文档的0行0列位置开始:(注释也不能加!!!)

③、文档声明只有属性:

a)     versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;

b)     encoding:指定当前文档的编码。可选属性,默认值是。utf-8:

2、元素element:

①.元素是XML文档中最重要的组成部分,

②.普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>

③.元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a ></b>

④.空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭介,例如:<c/>

⑤.元素命名:

a)     区分大小写

b)     不能使用空格,不能使用冒号:

c)     不建议以XML,  xml,  Xml开头

⑥.格式化良好的XML文档,必须只有一个根元素。

3、属性:

①.属性是元素的一部分,它必须出现在元素的开始标签中

②.属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引

③.一个元素可以有O ~ N个属性,但一个元素中不能出现同名属性

④.属性名不能使用空格、冒号等特殊字符,且必须以字母开头

4、注释:

XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!

5、转义字符:

XML中的转义字符与HTML一样。

  因为很多符号己经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:"<"、”>”、” ’ ”、” ” ”、”&”。

6、CDATA区:

  在CDATA段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。

      在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。

<?xml version="1.0" encoding="UTF-8"?>
<persons>
    <person class="黑色" height="192">
        <name>熊二</name>
        <age>22</age>
    </person>
    <person>
        <name>熊大</name>
        <age>
        <!-- 转义字符出现在以下区域内,会自动转义! -->
        <![CDATA[
            if(10>9&&9>8){
                aaaa;
            }
        ]]>
        </age>
    </person>
</persons>

四、DTD:

1、DTD (Document Type Definition ),文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。

2、我们都是通过框架提供的DTD约束文档,编写对应的XML文档。常见框架使用DTD约束有:struts2,  hibernate等。

<?xml version="1.0" encoding="UTF-8"?>
<!--
    模拟servlet2.3规范,如果开发人员需要在xml使用当前DTD约束,必须包括DOCTYPE。
    格式如下:
    <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
-->
<!ELEMENT web-app (servlet*,servlet-mapping* , welcome-file-list?) >
<!ELEMENT servlet (servlet-name,description?,(servlet-class|jsp-file))>
<!ELEMENT servlet-mapping (servlet-name,url-pattern+) >
<!ELEMENT servlet-name (#PCDATA)>
<!ELEMENT servlet-class (#PCDATA)>
<!ELEMENT url-pattern (#PCDATA)>
<!ELEMENT description (#PCDATA)>
<!ELEMENT jsp-file (#PCDATA)>

<!ELEMENT welcome-file-list (welcome-file+)>
<!ELEMENT welcome-file (#PCDATA)>

<!ATTLIST web-app version CDATA #IMPLIED>
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
<web-app>
    <servlet>
        <servlet-name>HelloServlet</servlet-name>
        <servlet-class>com.oracle.demo01.HelloServlet</servlet-class>

    </servlet>
    <servlet-mapping>
        <servlet-name>HelloServlet</servlet-name>
        <url-pattern>/hello</url-pattern>
    </servlet-mapping>

</web-app>

3、文档声明:

①、内部DTD,在XML文档内部嵌入DTD,只对当前XML有效。

②、外部DTD——本地DTD,DTD文档在本地系统system上,公司内部自己项目使用。

③、外部DTD——公共DTD,DTD文档在网络public+网址上,一般都有框架提供。

4、元素声明:

定义元素语法:<!ELEMENT元素名 元素描述>

    元素名:自定义

    元素描述包括 : 符号和数据类型

          常见符号: ?  *  +  ()  |  ,

          常见类型:#PCDATA表示内容是文本,不能是子标签

五、Schema约束:

1、介绍:

①、Schema是新的XML文档约束:

②、 Schema要比DTD强大很多,是DTD替代者;

③、Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml .

④、  Schema功能更强大,数据类型更完善

⑤、Schema支持名称空间

2、通过schema约束文档编写xml文档。常见框架使用schema的有:Spring等通过提供”web-app_ 2_ 5.xsd"编写xml文档

<?xml version="1.0" encoding="UTF-8"?>
<!-- 
    模拟servlet2.5规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。
    格式如下:
    <web-app xmlns="http://www.example.org/web-app_2_5" 
            xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
            xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
            version="2.5">
-->
<xsd:schema xmlns="http://www.w3.org/2001/XMLSchema" 
    targetNamespace="http://www.example.org/web-app_2_5"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema"
    xmlns:tns="http://www.example.org/web-app_2_5" 
    elementFormDefault="qualified">
    
    <xsd:element name="web-app">
        <xsd:complexType>
            <xsd:choice minOccurs="0" maxOccurs="unbounded">
                <xsd:element name="servlet">
                    <xsd:complexType>
                        <xsd:sequence>
                            <xsd:element name="servlet-name"></xsd:element>
                            <xsd:element name="servlet-class"></xsd:element>
                        </xsd:sequence>
                    </xsd:complexType>
                </xsd:element>
                <xsd:element name="servlet-mapping">
                    <xsd:complexType>
                        <xsd:sequence>
                            <xsd:element name="servlet-name"></xsd:element>
                            <xsd:element name="url-pattern" maxOccurs="unbounded"></xsd:element>
                        </xsd:sequence>
                    </xsd:complexType>
                </xsd:element>
                <xsd:element name="welcome-file-list">
                    <xsd:complexType>
                        <xsd:sequence>
                            <xsd:element name="welcome-file" maxOccurs="unbounded"></xsd:element>
                        </xsd:sequence>
                    </xsd:complexType>
                </xsd:element>
            </xsd:choice>
            <xsd:attribute name="version" type="double" use="optional"></xsd:attribute>
        </xsd:complexType>
    </xsd:element>
</xsd:schema>
<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
    version="2.5">
    <servlet>
        <servlet-name></servlet-name>
        <servlet-class></servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name></servlet-name>
        <url-pattern></url-pattern>
    </servlet-mapping>
</web-app>

六、dom4j解析:

1、XML的解析方式:

开发中比较常见的解析方式有三种,如下:

①、DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。

        a)  优点:元素与元素之间保留结构关系,故可以进行增删改查操作。

        b)  缺点:XML文档过大,可能出现内存溢出显现。

②、SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件    驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)

      a)  优点:处理速度快,可以处理大文件

      b)  缺点:只能读,逐行后将释放资源。

③、PULL:  Android内置的XML解析方式,类似SAX。(了解)

 2、解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。

常见的解析开发包:

①、 JAXP: sun公司提供支持DOM和SAX开发包

②、 JDom:dom4j兄弟

③、 jsoup:一种处理HTML特定解析开发包

④、dom4j:比较常用的解析开发包,hibernate底层采用。

3、DOM解析原理及结构模型:

  XML DOM和HTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个DOM树,

并获得一个Document对象,通过Document对象就可以对DOM进行操作。

DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点!

4、API使用:

  dom4j必须使用核心类SaxReader加载xml文档获得Document通过Document对象获得文档的根元素,然后就可以操作了。

七、解析步骤:

1.创建解析器对象

2.使用解析器加载web.xml文件得到document对象

3.获取根元素节点

4.根据元素名称获取子元素节点

5.根据元素名称获取servlet-class的文本节点

6.通过类全名获取字节码文件

7.创建实例对象 

8.调用实例对象里面的方法

package com.oracle.demo04;

public class MyServlet {
    public void init(){
        System.out.println("init()正在执行");
    }
    public void service(){
        System.out.println("service()正在执行");
    }
    public void destroy(){
        System.out.println("destory()正在执行");
    }
}
<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
    version="2.5">
    <servlet>
        <servlet-name>MyServlet</servlet-name>
        <servlet-class>com.oracle.demo04.MyServlet</servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name>MyServlet</servlet-name>
        <url-pattern>/my</url-pattern>
    </servlet-mapping>
</web-app>
package com.oracle.demo04;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
//将数据按Schema约束写到XML里,然后通过dom4j解析出所有的元素,再用反射创建对象再调出其所有的方法!!!
public class Demo {
    public static void main(String[] args) throws DocumentException, ClassNotFoundException, InstantiationException, IllegalAccessException {
        // 1.获取解析器
        SAXReader sax=new SAXReader();
        // 2.获得document文档对象
        Document doc=sax.read("src/com/oracle/demo04/web.xml");
        // 3.获取根元素
        Element element=doc.getRootElement();
        // 4.判断元素名称为servlet的元素
        Element servlet=element.element("servlet");
        // 5.获取servlet-class元素
        Element className=servlet.element("servlet-class");
        //System.out.println(className.getText());获取当前元素的文本内容
        //开始反射获取MyServlet的字节码文件对象
        Class c=Class.forName(className.getText());
        //快速创建对象
        Object obj=c.newInstance();
        //向下转型
        MyServlet my=(MyServlet) obj;
        my.init();
        my.service();
        my.destroy();
    }
}

 

posted @ 2019-06-26 18:01  壹叶知秋  阅读(205)  评论(0编辑  收藏  举报