XML、CDATA、DTD、Schema约束、DOM4j

summarize:

关于Servlet的理解,是Java Servlet简称,称为小服务程序或服务连接器,用Java写的服务器端程序,有独立于平台和协议的特性,主要功能在于交互式地浏览和生成数据,生成动态Web内容,任何一台计算机都可以装服务端的应用程序,谁装了谁就一台服务器。

XML跟HTML是亲兄弟,都有一个爹 w3c :万维网联盟

都是可扩展标记语言,区别:HTML元素都是固定,XML元素可自定义。XML不会向下兼容,所以使用1.0。DTD用来约束XML文档

 

模拟Servlet执行

Java Servlet是运行在web服务器或应用在服务器上的程序,在WEB编程中,我们通过浏览器访问WEB服务器上的资源,WEB服务器就是另一台计算机

XML

 1.概念:Extensible Markup Language:可扩展的标记语言。语法和HTML较相似,HTML元素是固定,XML标签可以自定义

W3C在98年2月发布1.0版,04年2月发布1.1版,1.1版不能向下兼容,so没人用。04年2月W3C发布1.0第三版,我们学1.0第三版

2.功能

存储数据

  1.配置文件

  2.在网络中传输

3.xml与html区别

  1.xml标签都自定义,html预定义

  2.xml语法严格,html语法松散

  3 xml 存储数据,html显示数据 

2.语法(非常严格)

  *基本语法:

  1.xml后缀名  .xml

  2.xml第一行必须定义文档声明

  3.xml文档中有且仅有一个根标签

  4.属性值必须使用引号(单双都可以) 引起来

  5.标签必须正确关闭

  6.xml标签名区分大小写

*组成部分  3.4.5 跟html是一样的

  1.文档声明

    1.格式<?xml 属性列表 ?>

    2.属性列表:

      *version:版本号  必须的属性

      *encoding:编码方式  告知解析引擎当前文档使用的字符集,默认:ISO-8859-1

      *standalong:是否独立  

        *取值:

          *yes:不依赖其他文件

          *no:依赖其他文件

  2.指令(了解):结合css来控制标签样式 

     *<?xml-stylesheet type="text/css" href="a.css" ?>

  3.标签:标签名称自定义  

    *规则:

    1.名称可包含,字母、数字、其他字符

    2.不能以数字、标点符号开始

    3.不能一字母 xml(或者 XML、Xml等等)开始

    4.不能包含空格

  4.属性:

    id属性值是唯一

  5.文本:

    *CDATA区:在该区域中,数据会被原样展示

    *格式:<![CDATA[ 展示的数据 ]]>

 XML语法

1、文档声明

<?xml version="1.0" encoding="UTF-8"?>  必须放在第一行

①、文档声明必须为<?xml开头,以?>结束

②、必须从文档0行0列位置开始:注释也不能加

③、只有属性:

a)     versioin:指XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;

b)     encoding:指当前文档的编码。可选属性,默认值:utf-8 

2、元素element

①.元素是XML文档中最重要的组成部分

②.普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>

③.元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a ></b>

④.空元素:空元素只有开始标签,没有结束标签,但元素必须自己闭介,例如:<c/>

⑤.元素命名

a) 区分大小

b) 不能用空格,冒号:

c)不建议以XML,  xml,  Xml开头

⑥.格式化良好的XML文档,必须只有一个根元素

3、属性

①.是元素的一部分,必须出现在元素的开始标签中

②.属性的定义格式:属性名=属性值属性值必须用单引或双引

③.一个元素可以有O ~ N个属性,但不能出现同名属性

④.属性名不能使用空格、冒号特殊字符必须字母开头

4、注释

XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!

5、转义字符

XML中的转义字符与HTML一样。

  因很多符号己经被XML文档结构所使用,所以元素体或属性值中想使用这些符号就必须使用转义字符,例如:"<"、”>”、” ’ ”、” ” ”、”&”。

6、CDATA区

  在CDATA段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符,可以提高xml文档的可读性。

      在CDATA段中不能包含“]]>”,即CDATA段的结束定界符 

<?xml version="1.0" encoding="UTF-8"?>
<persons>
    <person color="黑色" height="192">
        <name>袁一鸣</name>
        <age>40</age>
    </person>
    <person>
        <name>胸大</name>
        <age>12&lt;
        <!-- 下面为CDATA转义字符,会自动转义! -->
        <![CDATA[
            if(10>9&&9>8){
            aaaa;
            }
        ]]>            
        </age>
    </person>
</persons>

DTD

1、DTD (Document Type Definition ),文档类型定义,用来约束XML文档规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。

2、我们都是通过框架提供DTD约束文档,编写对应的XML文档。常见框架使用DTD约束有:struts2,  hibernate等

导入dtd框架步骤

新建个.xml文档,把.dtd复制到xml文档同目录。

把.dtd文档下的这行格式 复制到 新建的xml文档里 

<?xml version="1.0" encoding="UTF-8"?>
<!--
    模拟servlet2.3规范,如果开发人员需要在xml使用当前DTD约束,必须包括DOCTYPE。
    格式如下:
    <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
-->
<!ELEMENT web-app (servlet*,servlet-mapping* , welcome-file-list?) >
<!ELEMENT servlet (servlet-name,description?,(servlet-class|jsp-file))>
<!ELEMENT servlet-mapping (servlet-name,url-pattern+) >
<!ELEMENT servlet-name (#PCDATA)>
<!ELEMENT servlet-class (#PCDATA)>
<!ELEMENT url-pattern (#PCDATA)>
<!ELEMENT description (#PCDATA)>
<!ELEMENT jsp-file (#PCDATA)>

<!ELEMENT welcome-file-list (welcome-file+)>
<!ELEMENT welcome-file (#PCDATA)>

<!ATTLIST web-app version CDATA #IMPLIED>
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
<web-app>
    <servlet>
        <servlet-name>HelloServlet</servlet-name>
        <servlet-class>com.oracle.demo01.HelloServlet</servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name>HelloServlet</servlet-name>
        <url-pattern>/hello</url-pattern>
    </servlet-mapping>
</web-app>

3.文档声明

①、内部DTD,在XML文档内部嵌入DTD,只对当前XML有效

②、外部DTD——本地DTD,文档在本地系统system上,公司内部自己项目使用

③、外部DTD——公共DTD,DTD在网络public+网址上,一般都有框架提供

4、元素声明

定义元素语法:<!ELEMENT元素名 元素描述>

元素名:自定义

元素描述包括 :符号和数据类型

          常见符号:?  *  +  ()  |  ,

          常见类型:#PCDATA表示内容是文本不能子标签

 

5、属性声明

Schema约束

what's the Scheme?

 Schema:1.是新的XML文档约束、2.比DTD强大很多,是DTD替代者3.本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml 4.功能更强大,数据类型更完善 5.支持名称空间

 重点要求

通过schema约束文档编写xml文档。常见框架使用schema的有:Spring等通过提供”web-app_ 2_ 5.xsd"编写xml文档

<?xml version="1.0" encoding="UTF-8"?>
<!-- 
    模拟servlet2.5规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。
    格式如下:
    <web-app xmlns="http://www.example.org/web-app_2_5" 
            xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
            xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
            version="2.5">
-->
<xsd:schema xmlns="http://www.w3.org/2001/XMLSchema" 
    targetNamespace="http://www.example.org/web-app_2_5"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema"
    xmlns:tns="http://www.example.org/web-app_2_5" 
    elementFormDefault="qualified">
    
    <xsd:element name="web-app">
        <xsd:complexType>
            <xsd:choice minOccurs="0" maxOccurs="unbounded">
                <xsd:element name="servlet">
                    <xsd:complexType>
                        <xsd:sequence>
                            <xsd:element name="servlet-name"></xsd:element>
                            <xsd:element name="servlet-class"></xsd:element>
                        </xsd:sequence>
                    </xsd:complexType>
                </xsd:element>
                <xsd:element name="servlet-mapping">
                    <xsd:complexType>
                        <xsd:sequence>
                            <xsd:element name="servlet-name"></xsd:element>
                            <xsd:element name="url-pattern" maxOccurs="unbounded"></xsd:element>
                        </xsd:sequence>
                    </xsd:complexType>
                </xsd:element>
                <xsd:element name="welcome-file-list">
                    <xsd:complexType>
                        <xsd:sequence>
                            <xsd:element name="welcome-file" maxOccurs="unbounded"></xsd:element>
                        </xsd:sequence>
                    </xsd:complexType>
                </xsd:element>
            </xsd:choice>
            <xsd:attribute name="version" type="double" use="optional"></xsd:attribute>
        </xsd:complexType>
    </xsd:element>
</xsd:schema>
<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
    version="2.5">
    <servlet>
        <servlet-name></servlet-name>
        <servlet-class></servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name></servlet-name>
        <url-pattern></url-pattern>
    </servlet-mapping>
</web-app>

pm

dom4j解析

1、XML的解析方式:

开发中常见的三种解析方式

①、DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。

        a)  优点:元素与元素保留结构关系,可增删改查

        b)  缺点:XML文档过大,可能出现内存溢出

②、SAX:是一种速度更快,更有效的方法。它逐行扫描文档,边扫描边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件 (了解)

      a)  优点:处理速度快可处理大文件

      b)  缺点:只能读,逐行后将释放资源。

③、PULL:  Android内置的XML解析方式,类似SAX。(了解)

 2、解析器:根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。

常见的解析开发包:

①、 JAXP: sun公司提供支持DOM和SAX开发包

②、 JDom:dom4j兄弟

③、 jsoup:一种处理HTML特定解析开发包

④、dom4j:比较常用的解析开发包,hibernate底层采用。

3、DOM解析原理及结构模型:

  XML DOM和HTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个DOM树,

并获得一个Document对象,通过Document对象就可以对DOM进行操作。

DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点!

 

4、API使用:

  dom4j必须使用核心类SaxReader加载xml文档获得Document,通过Document对象获得文档的根元素

 

解析步骤:

1.创建解析器对象

2.使用解析器加载web.xml文件得到document对象

3.获取根元素节点

4.根据元素名称获取子元素节点

5.根据元素名称获取servlet-class的文本节点

6.通过类全名获取字节码文件

7.创建实例对象 

8.调用实例对象里面的方法

 

package com.oracle.demo04;

public class MyServlet {
    public void init(){
        System.out.println("init()正在执行");
    }
    public void service(){
        System.out.println("service()正在执行");
    }
    public void destroy(){
        System.out.println("destroy()正在运行 ");
    }
}
<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://www.example.org/web-app_2_5" 
            xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
            xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
            version="2.5">
    <servlet>
        <servlet-name>MyServlet</servlet-name>
        <servlet-class>com.oracle.demo04.MyServlet</servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name>MyServlet</servlet-name>
        <url-pattern>/my</url-pattern>
    </servlet-mapping>
</web-app>
package com.oracle.demo04;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
//将数据按Schema约束写到XML里,然后通过dom4j解析出所有的元素,再用反射创建对象再调出其所有的方法!!!
public class Demo {
  public static void main(String[] args) throws DocumentException, ClassNotFoundException, InstantiationException, IllegalAccessException {
      // 1.获取解析器
      SAXReader sax=new SAXReader();
      // 2.获得document文档对象
      Document doc=sax.read("src/com/oracle/demo04/web.xml");
      // 3.获取根元素
      Element element=doc.getRootElement();
      // 4.判断元素名称为servlet的元素
      Element servlet=element.element("servlet");
      // 5.获取servlet-class元素
      Element className=servlet.element("servlet-class");
      //System.out.println(className.getText());获取当前元素的文本内容
      //开始反射获取MyServlet的字节码文件对象
      Class c=Class.forName(className.getText());
      //快速创建对象
      Object obj=c.newInstance();
      //向下转型
      MyServlet my=(MyServlet) obj;
      my.init();
      my.service();
      my.destroy();
  }
}

 

posted @ 2019-06-26 11:58  zhansen521  阅读(417)  评论(0编辑  收藏  举报