xml
1.XML
xml用途 是独立于软件和硬件的信息传输工具 简化了数据存储、共享和数据传输,简化了平台变更
为了灵活实现的不同路径(/hello)执行不同的资源( HeIIoMyServlet)我们需要使用XML进行配置;为了限定XML内容,我们需要使用xml约束(DTD或schema);为了获得xml的内容,我们需要使用dom4j进行解析
常见应用 存储数据 配置文件
XML语法:
XML文档声明 文档声明必须为<?xml开头,以?>结束; 文档声明必须从文档的0行0列位置开始 <?xml version="1.0" encoding="UTF-8"?>
文档声明只有属性:a) versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;b) encoding:指定当前文档的编码。可选属性,默认值是。utf-8
元素element
1.元素是XML文档中最重要的组成部分,
2.普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>
3.元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a ></b>
4.空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭介,例如:<c/>
5.元素命名:
a) 区分大小写
b) 不能使用空格,不能使用冒号:
c) 不建议以XML, xml, Xml开头
6.格式化良好的XML文档,必须只有一个根元素。
属性
1.属性是元素的一部分,它必须出现在元素的开始标签中
2.属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引
3.一个元素可以有O ~ N个属性,但一个元素中不能出现同名属性
4.属性名不能使用空格、冒号等特殊字符,且必须以字母开头
注释
XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略
转义字符 因为很多符号己经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:"<"、”>”、” ’ ”、” ” ”、”&”
CDATA区
当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。
在CDATA段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。
在CDATA段中不能包含“]]>”,即CDATA段的结束定界符
<person> <name>循环体</name> <age>18 <!-- 在CDATA段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符。 这可以提高xml文档的可读性 --> <![CDATA[ if(a<b&&b<c&&e<f){ a=a+1; } ]]> </age> </person> <person> <name>夏威夷</name> <age>a<b?a:b</age> </person> </persons>
2.DTD
DTD (Document Type Definition )文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等
案例实现步骤
1.创建web.xml文档,并将“web-app_ 2_ 3.dtd"拷贝相同目录下
2.从DTD文档开始处,拷贝需要的“文档声明
3.完成xml内容编写
文档声明
1.内部DTD,在XML文档内部嵌入DTD,只对当前XML有效
2.外部DTD——本地DTD,DTD文档在本地系统上,公司内部自己项目使用
3.外部DTD——公共DTD,DTD文档在网络上,一般都有框架提供
元素声明
定义元素语法:<!ELEMENT元素名 元素描述>
元素名:自定义
元素描述包括 : 符号和数据类型
常见符号: ? * + () | ,
常见类型:#PCDATA表示内容是文本,不能是子标签
<!ELEMENT web-app(servlet*,servlet-mapping*,welcome-file-list?)> web-app包括3个标签,且必须顺序出现。 servlet子标签个数任意 servlet-mapping子标签个数任意 welcome-file-list子标签最多只能出现一次 <!ELEMENT servlet(servlet-name,description?,(servlet-class|jsp-file))> servlet有3个子标签,且必须顺序出现 servlet-name,必须有,且只能出现1次 description,可选1次 servlet-class和jsp-file二选一,且只能出现一次 <!ELEMENT servlet-name(#PCDATA)> servlet-name的标签体必须是文本 <!ELEMENT welcome-file-list (welcome-file+)> welcome-file-list至少有1个子标签welcome-file
3.Schema约束:
1、介绍:
①、Schema是新的XML文档约束:
②、 Schema要比DTD强大很多,是DTD替代者;
③、Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml .
④、 Schema功能更强大,数据类型更完善
⑤、Schema支持名称空间
2、通过schema约束文档编写xml文档。常见框架使用schema的有:Spring等通过提供”web-app_ 2_ 5.xsd"编写xml文档
<?xml version="1.0" encoding="UTF-8"?> <!-- 模拟servlet2.5规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。 格式如下: <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> --> <xsd:schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.example.org/web-app_2_5" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:tns="http://www.example.org/web-app_2_5" elementFormDefault="qualified"> <xsd:element name="web-app"> <xsd:complexType> <xsd:choice minOccurs="0" maxOccurs="unbounded"> <xsd:element name="servlet"> <xsd:complexType> <xsd:sequence> <xsd:element name="servlet-name"></xsd:element> <xsd:element name="servlet-class"></xsd:element> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="servlet-mapping"> <xsd:complexType> <xsd:sequence> <xsd:element name="servlet-name"></xsd:element> <xsd:element name="url-pattern" maxOccurs="unbounded"></xsd:element> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="welcome-file-list"> <xsd:complexType> <xsd:sequence> <xsd:element name="welcome-file" maxOccurs="unbounded"></xsd:element> </xsd:sequence> </xsd:complexType> </xsd:element> </xsd:choice> <xsd:attribute name="version" type="double" use="optional"></xsd:attribute> </xsd:complexType> </xsd:element> </xsd:schema>
<?xml version="1.0" encoding="UTF-8"?> <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> <servlet> <servlet-name></servlet-name> <servlet-class></servlet-class> </servlet> <servlet-mapping> <servlet-name></servlet-name> <url-pattern></url-pattern> </servlet-mapping> </web-app>
注意:Schema约束与DTD约束区别 声明 放在根标签 元素中 DTD是!DOCTYPE 也是最好的判断约束的方法
4. dom4j解析
Xml解析方式和解析器
开发中比较常见的解析方式有三种,如下:
- DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。
a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b) 缺点:XML文档过大,可能出现内存溢出显现。
2.SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件 驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)
a. 优点:处理速度快,可以处理大文件
b) 缺点:只能读,逐行后将释放资源。
3. PULL: Android内置的XML解析方式,类似SAX。(了解)
常见的解析开发包:
JAXP: sun公司提供支持DOM和SAX开发包
JDom:dom4j兄弟
jsoup:一种处理HTML特定解析开发包
dom4j:比较常用的解析开发包,hibernate底层采用
DOM解析原理及结构模型:
XML DOM和HTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个DOM树,
并获得一个Document对象,通过Document对象就可以对DOM进行操作。
DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点!
步骤:
1.获取解析器
2.获得document文档对象
3.获取根元素
4.获取根元素下的子元素
5.遍历子元素
6.判断元素名称为servlet的元素
7.获取servlet-name元素
8.获取servlet-class元素
package com.oracle.demo04; import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.Element; import org.dom4j.io.SAXReader; public class Demo01 { public static void main(String[] args) throws DocumentException, ClassNotFoundException, InstantiationException, IllegalAccessException { //解析web.xml获取Servlet完整报名加类名并创建对象调用方法 //创建saxreader对象 SAXReader sax=new SAXReader(); //加载xml文件获取文档对象 Document doc=sax.read("src/com/oracle/demo04/web.xml"); //获取根元素对象 Element root=doc.getRootElement(); //获取根元素对象下的第一个Servlet元素对象 Element servlet=root.element("servlet"); //获取Servlet元素下的第一个servlet-class对象 Element servletClass=servlet.element("servlet-class"); System.out.println(servletClass); //获取该元素的内容(完整的包名+类名) String className=servletClass.getText(); System.out.println(className); //获取该类的字节文件对象 Class c=Class.forName(className); //快速创建该类对象 MyServlet my=(MyServlet) c.newInstance(); my.init(); my.service(); my.detroy(); } }