XML基础+Java解析XML +几种解析方式的性能比较（转载）

原文出处：https://www.cnblogs.com/xtdxs/p/6628851.html

一：XML基础

　　XML是什么:

　　可扩展的标记语言

　　XML能干什么:

　　描述数据、存储数据、传输（交换）数据。

　　XML与HTML区别：

　　目的不一样

　　　　XML 被设计用来描述数据，其焦点是数据的内容。

　　　　HTML 被设计用来展示数据，其焦点是数据的外观。

　　　　HTML可以不关闭标签（即标签可以不成对出现），但XML必须关闭标签（即标签必须成对出现）。

　　　　HTML中的标签标识文本如何展示，而XML中的标签标识文本是什么含义（什么类型的文本）。

　　XML文档节点类型

　　文档(document)

　　元素(element)

　　属性(attribute)

　　文本(PCDATA--parsed character data)

　　注释(comment)

　　DOCTYPE ：主要验证文档内容的正确性

　　实体(ENTITIES)

　　CDATA(character data)

　　XML语法

　　　　1、声明：<?xmlversion="1.0" encoding="UTF-8"?>

　　　　2、根节点：必须有一个根节点

　　　　3、标签：标签必须有结束且区分大小写，标签必须顺序嵌套

　　　　4、属性：必须引号引起值

　　　　5、空格会被保留，HTML空格最多保留一个

　　　　6、命名规则：命名必须见名知意

　　　　a)名字可包含字母、数字以及其他的字符

　　　　b)名字不能以数字或者标点符号开始

　　　　c)名字不能以字符“xml”（或者XML、Xml）开始

　　　　7、名字不能包含空格

　　　　8、 不应在 XML 元素名称中使用 ":" ，这是由于它用于命名空间（namespaces）的保留字。

　　　　9、标签优先于属性。

　　　　10、XML 命名空间可提供避免元素命名冲突的方法。

　　　　11、CDATA：字符数据，<![CDATA[字符数据]]> ，字符数据不进行转义

　　　　12、实体：&实体;

　　Xml约束

　　　　XML DTD 约束

　　　　DTD（DocType Definition 文档类型定义）的作用是定义 XML 文档的合法构建模块。

　　　　它使用一系列的合法元素来定义文档结构。用于约定XML格式。

　　　　1、DTD引用方式

　　　　　1)、内部 <!DOCTYPE 根元素 [元素声明]>

　　　　　　　　例如：

　　　　　　　　<?xml version="1.0"encoding="UTF-8" standalone="yes"?>

　　　　　　　　<!DOCTYPE 书架 [

　　　　　　　　<!ELEMENT 书架 (书+)>

　　　　　　　　<!ELEMENT 书 (书名,作者,售价)>

　　　　　　　　<!ELEMENT 书名 (#PCDATA)>

　　　　　　　　<!ELEMENT 作者 (#PCDATA)>

　　　　　　　　<!ELEMENT 售价 (#PCDATA)>

　　　　　　　　<书架>

　　　　　　　　　　<书>

　　　　　　　　<书名>Java就业培训教程</书名>

　　　　　　　　<作者>张孝祥</作者>

　　　　　　　　<售价>39.00元</售价>

　　　　　　　　　　</书>

　　　　　　　　　　...

　　　　　　　　</书架>

　　　　2)、外部私有的 SYSTEM 一般是我们自己定义的，可能只是一个公司内部使用

　　　　　　 <!DOCTYPE 根元素 SYSTEM "dtd文件位置">

　　　　　　例如：

　　　　　　<?xml version="1.0" encoding="UTF-8"?>

　　　　　　<!DOCTYPE 书架 SYSTEM "book.dtd">

　　　　　　<书架>

　　　　　　<书>

　　　　　　<书名>java编程思想</书名>

　　　　　　<作者>Brnee</作者>

　　　　　　<售价>80</售价>

　　　　　　</书>

　　　　　　</书架>

　　　　3)、外部公有的 PUBLIC 一般是一些标准，可能非常多的人用

　　　　　　<!DOCTYPE 根元素 PUBLIC "命名空间""dtd文件位置">

　　　　　　首先根据“命名空间”去问环境要相应的dtd文件，如果有，直接提供，如果没有再根据dtd文件位置找。

　　　　例如：<!DOCTYPE web-app PUBLIC "-//SunMicrosystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">

　　2、例子：

　　<?xml version="1.0"?>

　　<!DOCTYPE note [

  　　<!ELEMENT note (to,from,heading,body)>

 　　 <!ELEMENT to      (#PCDATA)>

  　　<!ELEMENT from    (#PCDATA)>

  　　<!ELEMENT heading (#PCDATA)>

  　　<!ELEMENT body    (#PCDATA)>

]>

　　<note>

  　　<to>Tove</to>

  　　<from>Jani</from>

  　　<heading>Reminder</heading>

  　　<body>Don't forget me this weekend</body>

　　</note>

　　XML Schema 约束

　　XML Schema 是基于 XML 的 DTD 替代者。XML Schema 描述 XML 文档的结构。XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。

　　DTD不是通过XML语法定义文档结构，不能定义数据类型和限制Schema通过XML语法定义文档结构，可以定义数据类型和限制

　　约定XML格式

定义可出现在文档中的元素
定义可出现在文档中的属性
定义哪个元素是子元素
定义子元素的次序
定义子元素的数目
定义元素是否为空，或者是否可包含文本
定义元素和属性的数据类型
定义元素和属性的默认值以及固定值

　　1、为何使用Schema

　　XML Schema 是 DTD 的继任者

XML Schema 可针对未来的需求进行扩展
XML Schema 更完善，功能更强大
XML Schema 基于 XML 编写
XML Schema 支持数据类型和限制
XML Schema 支持命名空间

　　2、Schema引用方式

　　<users xmlns="命名空间"

　　 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

　　 xsi:schemaLocation="命名空间 Schema位置">

　　　　如何找Schema，和DTD一样，首先根据命名空间问环境要，找不到再根据Schema位置找。

　　3、例子：

　　<?xml version="1.0" encoding="UTF-8"?>

　　<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"

targetNamespace="http://www.zhong.cn"

elementFormDefault="qualified">

<!-- schema 是根元素

　　xmlns:xs="http://www.w3.org/2001/XMLSchema"

　　指明了在schema中使用的元素和数据种类来自http://www.w3.org/2001/XMLSchema名称空间（namespace）。

　　它也指定了来自"http://www.w3.org/2001/XMLSchema"名称空间（namespace）的元素和数据种类必须带前缀“xs:”

　　targetNamespace="http://www.zhong.cn"(将全部元素绑定给这个名称空间)

　　暗示了由这份schema(shiporder, orderperson, shipto, ....)定义的元素来自"http://www.zhong.com"名称空间

　　 xmlns="http://www.w3schools.com"

　　指明了默认名称空间（namespace）是http://www.w3schools.com.

　　elementFormDefault="qualified" （“unqualified”）将根节点绑定到名称空间

　将所有元素绑定到名称空间

　　-->

<xs:element name="shiporder">

<xs:complexType>

<xs:sequence>

<xs:element name="orderperson" type="xs:string"/>

<xs:element name="shipto" minOccurs="1" maxOccurs="1">

<xs:complexType>

<xs:sequence>

<xs:element name="name" type="xs:string"/>

　　<xs:element name="address" type="xs:string"/>

　　<xs:element name="city" type="xs:string"/>

　　<xs:element name="country" type="xs:string"/>

　　</xs:sequence>

　　</xs:complexType>

　　</xs:element>

<xs:element name="item" maxOccurs="unbounded">

　　 <xs:complexType>

　　<xs:sequence>

　　<xs:element name="title" type="xs:string"/>

　　<xs:element name="note" type="xs:string" minOccurs="0"/>

　　<xs:element name="quantity" type="xs:positiveInteger"/>

　　<xs:element name="price" type="xs:decimal"/>

　　</xs:sequence>

　　</xs:complexType>

　　</xs:element>

　　</xs:sequence>

　　<xs:attribute name="orderid" type="xs:string" use="required"/>

　　</xs:complexType>

　　</xs:element>

　　</xs:schema>

二、Java解析XML

　　XML解析方式分为两种：dom和sax

　　• dom：(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式。

　　• sax： (Simple API for XML) 不是官方标准，但它是XML 社区事实上的标准，几乎所有的 XML 解析器都支持它。

　　XML解析器

　　• Crimson、Xerces 、Aelfred2

XML解析开发包

　　• Jaxp、Jdom、dom4j

　　1、DOM解析

　　　　DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。

　　分析该结构通常需要加载整个文档和构造层次结构，然后才能做任何工作。由于它是基于信息层次的，因而DOM被认为是基于树或基于对象的。

　　DOM解析器把XML文档转化为一个包含其内容的树，并可以对树进行遍历。

　　DOM是拉模型，在遍历文档时，会把感兴趣的部分从读取器中拉出，不需要引发事件，允许我们选择性地处理节点。这大大提高了灵活性，以及整体效率。

　　JAXP（DOM解析）

　　JAXP 开发包是J2SE的一部分，它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成

　　在 javax.xml.parsers 包中，定义了几个工厂类，程序员调用这些工厂类，可以得到对xml文档进行解析的 DOM 或 SAX的解析器对象。

　　java代码显例：

　　<?xml version="1.0" encoding="UTF-8" standalone="no"?><exam>

　　</student>

　　</student>

　　 </student>

　　　</student>

　　</exam>

　　package com.zhong.xml.parse;

　　import java.io.BufferedReader;

　　import java.io.File;

　　import java.io.IOException;

　　import java.io.InputStreamReader;

　　import javax.xml.parsers.DocumentBuilder;

　　import javax.xml.parsers.DocumentBuilderFactory;

　　import javax.xml.parsers.ParserConfigurationException;

　　import javax.xml.transform.Transformer;

　　import javax.xml.transform.TransformerException;

　　import javax.xml.transform.TransformerFactory;

　　import javax.xml.transform.dom.DOMSource;

　　import javax.xml.transform.stream.StreamResult;

　　import org.w3c.dom.Document;

　　import org.w3c.dom.Element;

　　import org.w3c.dom.Node;

　　import org.w3c.dom.NodeList;

　　import org.xml.sax.SAXException;

　　public class JaxpDemo {

/**

　　* @param args

　　* @throws IOException

　　public static void main(String[] args) throws Exception {

　　 System.out.print("添加用户：(a) ");

　　System.out.print("删除用户：(b) ");

　　System.out.println("查询成绩：(c)");

　　System.out.print("请输入操作类型：");

　　BufferedReader br = new BufferedReader(new InputStreamReader(System.in));

　　String type = br.readLine();

　　if("a".equals(type)){

　　//添加用户

　　Student student = new Student();

　　System.out.print("请输入学生姓名：");

　　String name = br.readLine();

　　student.setName(name);

　　System.out.print("请输入学生准考证号：");

　　String examid = br.readLine();

　　student.setExamid(examid);

　　System.out.print("请输入学生身份证号：");

　　 String idcart = br.readLine();

　　student.setIdcart(idcart);

　　System.out.print("请输入学生所在地：");

　　String location = br.readLine();

　　student.setLocation(location);

　　System.out.print("请输入学生成绩：");

　　String grade = br.readLine();

　　student.setGrade(grade);

　　add(student);

　　System.out.println("------添加数据成功------");

　　 }else if("b".equals(type)){

　　//删除用户

　　 System.out.print("请输入删除的学生姓名：");

　　String name = br.readLine();

　　delete(name);

　　System.out.println("------已成功删除学生信息------");

　　}else if("c".equals(type)){

　　//查询成绩

　　System.out.print("请输入查询的学生准考证号：");

　　String examid = br.readLine();

　　Student student = find(examid);

　　System.out.println("您查询的学生信息为：");

　　System.out.println(student);

　　}else{

　　System.out.println("对不起，您的操作有误！！");

　　 }

　　private static Student find(String examid) throws Exception {

　　Document document = getDocument();

　　NodeList list = document.getElementsByTagName("student");

　　for(int i=0;i<list.getLength();i++){

　　Element element = (Element) list.item(i);

　　String value = element.getAttribute("examid");

　　if(examid.equals(value)){

　　Student student = new Student();

　　student.setExamid(examid);

　　student.setIdcart(element.getAttribute("idcart"));

　　student.setName(element.getElementsByTagName("name").item(0).getTextContent());

　　 student.setLocation(element.getElementsByTagName("location").item(0).getTextContent());

　　student.setGrade(element.getElementsByTagName("grade").item(0).getTextContent());

　　return student;

　　}

　　return null;

　　 }

　　private static void delete(String name) throws ParserConfigurationException, SAXException, IOException, TransformerException {

　　 Document document = getDocument();

　　NodeList list = document.getElementsByTagName("name");

　　for(int i=0;i<list.getLength();i++){

　　Node node = list.item(i);

　　if(node.getTextContent().equals(name)){

　　node.getParentNode().getParentNode().removeChild(node.getParentNode());

　　}

　　writeXml(document);

　　}

　　private static void add(Student student) throws Exception {

　　Document document = getDocument();

　　Element student_node = document.createElement("student");

　　student_node.setAttribute("idcart", student.getIdcart());

　　student_node.setAttribute("examid", student.getExamid());

　　Node name = document.createElement("name");

　　name.setTextContent(student.getName());

　　Node location = document.createElement("location");

　　location.setTextContent(student.getLocation());

　　 Node grade = document.createElement("grade");

　　grade.setTextContent(student.getGrade());

　　 student_node.appendChild(name);

　　student_node.appendChild(location);

　　student_node.appendChild(grade);

　　Element root = document.getDocumentElement();

　　root.appendChild(student_node);

　　 writeXml(document);

　　 }

　　//将内存中的数据保存到XML文件中

　　private static void writeXml(Document document) throws TransformerException {

　　DOMSource source = new DOMSource(document);

　　StreamResult result = new StreamResult(new File("src/exam.xml"));

　　TransformerFactory factory = TransformerFactory.newInstance();

　　Transformer trans = factory.newTransformer();

　　trans.transform(source, result);

　　 }

　　//获得操作xml文件的对象

　　 private static Document getDocument() throws ParserConfigurationException,

　　SAXException, IOException {

　　DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();//得到创建 DOM 解析器的工厂。

　　DocumentBuilder builder = factory.newDocumentBuilder();//得到 DOM 解析器对象。

　　 Document document = builder.parse(new File("src/exam.xml")); //得到代表整个文档的 Document 对象

　　 Element e = document.getDocumentElement();

　　return document;

　　}　　

DOM的基本对象有5个：Document，Node，NodeList，Element和Attr。

　　 Document对象

　　　　代表了整个XML的文档，所有其它的Node，都以一定的顺序包含在Document对象之内，排列成一个树形的结构，程序员可以通过遍历这颗树来得到XML文档的所有的内容，

　　这也是对XML文档操作的起点。我们总是先通过解析XML源文件而得到一个Document对象，然后再来执行后续的操作。此外，Document还包含了创建其它节点的方法，

　　比如createAttribut()用来创建一个Attr对象。它所包含的主要的方法有：

　　createAttribute(String)：用给定的属性名创建一个Attr对象，并可在其后使用setAttributeNode方法来放置在某一个Element对象上面。

　　createElement(String)：用给定的标签名创建一个Element对象，代表XML文档中的一个标签，然后就可以在这个Element对象上添加属性或进行其它的操作。

　　createTextNode(String)：用给定的字符串创建一个Text对象，Text对象代表了标签或者属性中所包含的纯文本字符串。如果在一个标签内没有其它的标签，

　　那么标签内的文本所代表的Text对象是这个Element对象的唯一子对象。

　　getElementsByTagName(String)：返回一个NodeList对象，它包含了所有给定标签名字的标签。

　　getDocumentElement()：返回一个代表这个DOM树的根节点的Element对象，也就是代表XML文档根元素的那个对象。

　　Node对象

　　　　是DOM结构中最为基本的对象，代表了文档树中的一个抽象的节点。在实际使用的时候，很少会真正的用到Node这个对象，而是用到诸如Element、Attr、Text等

　　Node对象的子对象来操作文档。Node对象为这些对象提供了一个抽象的、公共的根。虽然在Node对象中定义了对其子节点进行存取的方法，但是有一些Node子对象，

　　比如Text对象，它并不存在子节点，这一点是要注意的。Node对象所包含的主要的方法有：

　　appendChild(org.w3c.dom.Node)：为这个节点添加一个子节点，并放在所有子节点的最后，如果这个子节点已经存在，则先把它删掉再添加进去。

　　getFirstChild()：如果节点存在子节点，则返回第一个子节点，对等的，还有getLastChild()方法返回最后一个子节点。

　　getNextSibling()：返回在DOM树中这个节点的下一个兄弟节点，对等的，还有getPreviousSibling()方法返回其前一个兄弟节点。

　　getNodeName()：根据节点的类型返回节点的名称。

　　getNodeType()：返回节点的类型。

　　getNodeValue()：返回节点的值。

　　hasChildNodes()：判断是不是存在有子节点。

　　hasAttributes()：判断这个节点是否存在有属性。

　　getOwnerDocument()：返回节点所处的Document对象。

　　insertBefore(org.w3c.dom.Node new，org.w3c.dom.Node ref)：在给定的一个子对象前再插入一个子对象。

　　removeChild(org.w3c.dom.Node)：删除给定的子节点对象。

　　replaceChild(org.w3c.dom.Node new，org.w3c.dom.Node old)：用一个新的Node对象代替给定的子节点对象。

　 NodeList对象

　　顾名思义，就是代表了一个包含了一个或者多个Node的列表。可以简单的把它看成一个Node的数组，我们可以通过方法来获得列表中的元素：

　　getLength()：返回列表的长度。

　　item(int)：返回指定位置的Node对象。

Element对象

　　代表的是XML文档中的标签元素，继承于Node，亦是Node的最主要的子对象。在标签中可以包含有属性，因而Element对象中有存取其属性的方法，

　　而任何Node中定义的方法，也可以用在Element对象上面。

　　getElementsByTagName(String)：返回一个NodeList对象，它包含了在这个标签中其下的子孙节点中具有给定标签名字的标签。

　　getTagName()：返回一个代表这个标签名字的字符串。

　　getAttribute(String)：返回标签中给定属性名称的属性的值。在这儿需要主要的是，应为XML文档中允许有实体属性出现，而这个方法对这些实体属性并不适用。

　　这时候需要用到getAttributeNodes()方法来得到一个Attr对象来进行进一步的操作。

　　getAttributeNode(String)：返回一个代表给定属性名称的Attr对象。

Attr对象

　代表了某个标签中的属性。Attr继承于Node，但是因为Attr实际上是包含在Element中的，它并不能被看作是Element的子对象，因而在DOM中Attr并不是DOM树的一部分，

　所以Node中的getParentNode()，getPreviousSibling()和getNextSibling()返回的都将是null。也就是说，Attr其实是被看作包含它的Element对象的一部分，

　它并不作为DOM树中单独的一个节点出现。这一点在使用的时候要同其它的Node子对象相区别。

　　2、SAX解析

　　SAX是Simple API forXML的缩写，它并不是由W3C官方所提出的标准，可以说是“民间”的事实标准。实际上，它是一种社区性质的讨论产物。

　　虽然如此，在XML中对SAX的应用丝毫不比DOM少，几乎所有的XML解析器都会支持它。

　　与DOM比较而言，SAX是一种轻量型的方法。我们知道，在处理DOM的时候，我们需要读入整个的XML文档，然后在内存中创建DOM树，

　　生成DOM树上的每个Node对象。当文档比较小的时候，这不会造成什么问题，但是一旦文档大起来，处理DOM就会变得相当费时费力。

　　特别是其对于内存的需求，也将是成倍的增长，以至于在某些应用中使用DOM是一件很不划算的事（比如在applet中）。这时候，一个较好的替代解决方法就是SAX。

　　SAX在概念上与DOM完全不同。首先，不同于DOM的文档驱动，它是事件驱动的，也就是说，它并不需要读入整个文档，而文档的读入过程也就是SAX的解析过程。

　　所谓事件驱动，是指一种基于回调（callback）机制的程序运行方法。（如果你对Java新的代理事件模型比较清楚的话，就会很容易理解这种机制了）

　　回调：由我们在组件中定义，而不由我们调用，由容器或框架调用

　　SAX是推模型，它是一种靠事件驱动的模型。当它每发现一个节点就引发一个事件，而我们需要编写这些事件的处理程序。这样的做法很麻烦，且不灵活。

　　StAX 解析

　　针对于XML的流式API(StAX)，是在2004年3月的JSR 173规范中引入，这是一种针对XML的流式拉分析API。StAX是JDK 6.0提供的一种新特征。

　　一个推模型分析器不断地生成事件，直到XML文档被完全分析结束。但是，拉分析由应用程序进行调整；因此，分析事件是由应用程序生成的。

　　这意味着，使用StaX，你可以推迟分析-在分析时跳过元素并且分析多个文档。在使用DOM API的时候，你必须把整个的XML文档分析成一棵DOM结构，

　　这样也就降低了分析效率。而借助于StAX，在分析XML文档时生成分析事件。

　　JDOM

　　JDOM的目的是成为Java特定文档模型，它简化与XML的交互并且比使用DOM实现更快。由于是第一个Java特定模型，JDOM一直得到大力推广和促进。

　　正在考虑通过“Java规范请求JSR-102”将它最终用作“Java标准扩展”。从2000年初就已经开始了JDOM开发。

　　JDOM与DOM主要有两方面不同。首先，JDOM仅使用具体类而不使用接口。这在某些方面简化了API，但是也限制了灵活性。

　　第二，API大量使用了Collections类，简化了那些已经熟悉这些类的Java开发者的使用。

　　JDOM文档声明其目的是“使用20%（或更少）的精力解决80%（或更多）Java/XML问题”（根据学习曲线假定为20%）。

　　JDOM对于大多数Java/XML应用程序来说当然是有用的，并且大多数开发者发现API比DOM容易理解得多。JDOM还包括对程序行为的相当广

　　泛检查以防止用户做任何在XML中无意义的事。然而，它仍需要您充分理解XML以便做一些超出基本的工作（或者甚至理解某些情况下的错误）。

　　这也许是比学习DOM或JDOM接口都更有意义的工作。

　　JDOM自身不包含解析器。它通常使用SAX2解析器来解析和验证输入XML文档（尽管它还可以将以前构造的DOM表示作为输入）。

　　它包含一些转换器以将 JDOM表示输出成SAX2事件流、DOM模型或XML文本文档。JDOM是在Apache许可证变体下发布的开放源码。

　　DOM4J

　　http://dom4j.sourceforge.NET

　　虽然DOM4J代表了完全独立的开发结果，但最初，它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能，包括集成的XPath支持、

　　XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项，它通过DOM4J API和标准DOM接口具有并行访问功能。

　　从2000下半年开始，它就一直处于开发之中。

　　为支持所有这些功能，DOM4J使用接口和抽象基本类方法。DOM4J大量使用了API中的Collections类，但是在许多情况下，

　　它还提供一些替代方法以允许更好的性能或更直接的编码方法。直接好处是，虽然DOM4J付出了更复杂的API的代价，但是它提供了比JDOM大得多的灵活性。

　　在添加灵活性、XPath集成和对大文档处理的目标时，DOM4J的目标与JDOM是一样的：针对Java开发者的易用性和直观操作。

　　它还致力于成为比 JDOM更完整的解决方案，实现在本质上处理所有Java/XML问题的目标。在完成该目标时，它比JDOM更少强调防止不正确的应用程序行为。

　　DOM4J是一个非常非常优秀的JavaXML API，具有性能优异、功能强大和极端易用使用的特点，同时它也是一个开放源代码的软件。

　　如今你可以看到越来越多的Java软件都在使用DOM4J来读写XML，特别值得一提的是连Sun的JAXM也在用DOM4J.

　　代码显例：

　　<?xml version="1.0" encoding="UTF-8"?>

　　<exam>

　　</student>

　　</student>

　　</student>

　　 </student>

　　</exam>

　　package cn.zhong.dao;

　　import java.io.BufferedReader;

　　import java.io.File;

　　import java.io.FileOutputStream;

　　import java.io.IOException;

　　import java.io.InputStreamReader;

　　import java.util.Iterator;

　　import java.util.List;

　　import javax.xml.parsers.ParserConfigurationException;

　　import org.dom4j.Document;

　　import org.dom4j.DocumentException;

　　import org.dom4j.Element;

　　import org.dom4j.io.SAXReader;

　　import org.dom4j.io.XMLWriter;

　　import org.junit.Test;

　　import org.xml.sax.SAXException;

　　public class Dom4j_demo {

　　public static void main(String[] args) throws IOException,

ParserConfigurationException, SAXException, DocumentException {

　　System.out.println("添加学生 (a) 查找学生 (b) 删除学生 (c)");

　　System.out.print("请输入想要的操作:");

　　BufferedReader buf = new BufferedReader(

new InputStreamReader(System.in));

　　String value = buf.readLine();

　　if (value.equalsIgnoreCase("a")) {

　　 try {

　　System.out.print("请输入学生姓名：");

　　String name = buf.readLine();

　　System.out.print("请输入学生准考证号：");

　　String examid = buf.readLine();

　　System.out.print("请输入学生身份证号：");

　　String idcard = buf.readLine();

　　System.out.print("请输入学生所在地：");

　　String location = buf.readLine();

　　System.out.print("请输入学生成绩：");

　　String grade = buf.readLine();

　　 Student student = new Student();

　　student.setExamid(examid);

　　student.setGrade(Double.parseDouble(grade));

　　student.setIdcard(idcard);

　　student.setLocation(location);

　　student.setName(name);

// StudentDaoByJaxp sd = new StudentDaoByJaxp();

// sd.appUser(student);

　　Dom4j_demo dj = new Dom4j_demo();

　　dj.appUser(student);

　　System.out.println("恭喜你，添加成功");

　　dj.appUser(student);

　　 } catch (IOException e) {

　　System.out.println("输入有误，添加失败，请重新输入");

　　}

　　} else if (value.equalsIgnoreCase("b")) {

　　 System.out.print("请输入想查找的学生准考证号：");

　　String examid = buf.readLine();

　　Dom4j_demo dj = new Dom4j_demo();

　　Student s = dj.selectUser(examid);

　　 if (s != null) {

　　 System.out.println("你要查找的学生的信息如下：");

　　System.out.println("姓名：" + s.getName());

　　System.out.println("准考证号：" + s.getExamid());

　　System.out.println("身份证号：" + s.getIdcard());

　　System.out.println("所在地：" + s.getLocation());

　　System.out.println("成绩：" + s.getGrade());

　　} else {

　　System.out.println("你所查找的学生不存在");

　　 }

　　} else if (value.equalsIgnoreCase("c")) {

　　try {

　　System.out.print("请输入想删除的学生姓名：");

　　String name = buf.readLine();

　　Dom4j_demo dj = new Dom4j_demo();

　　dj.deleteUser(name);

　　System.out.println("恭喜你，删除成功");

　　 } catch (Exception e) {

　　System.out.println("删除失败，请重新来过");

　　 }

　　 } else {

　　System.out.println("请输入正确的指令");

　　}

　　// 增加学生

　　@Test

　　public void appUser(Student student) {

　　try {

　　Document document = getDocument();

　　Element rootNode = document.getRootElement();

　　Element sNode = rootNode.addElement("student");

　　sNode.addAttribute("examid", student.getExamid());

　　sNode.addAttribute("idcard", student.getIdcard());

　　sNode.addElement("name").setText(student.getName());

　　sNode.addElement("location").setText(student.getLocation());

　　sNode.addElement("grade").setText(student.getGrade() + "");

　　write2Xml(document);

　　 } catch (Exception e) {

　　throw new RuntimeException();

　　}

　　 // 查找学生

　　@Test

　　public Student selectUser(String examid) throws DocumentException {

　　Document document = getDocument();

　　Element e = (Element) document.selectSingleNode("//student[@examid='"

　　 + examid + "']");

　　if (e != null) {

　　Student s = new Student();

　　s.setExamid(e.attributeValue("examid"));

　　s.setIdcard(e.attributeValue("idcard"));

　　 s.setName(e.element("name").getText());

　　s.setLocation(e.element("location").getText());

　　 s.setGrade(Double.parseDouble(e.element("grade").getText()));

　　return s;

　　} else {

　　 return null;

　　 }

* // List list=document.getRootElement().selectNodes("student"); List

* list=document.selectNodes("//student");//使用xpath Iterator

* it=list.iterator(); while(it.hasNext()) { Element e=(Element)

* it.next(); String value=e.attributeValue("examid");

* if(value.equals(examid)) { Student s = new Student();

* s.setExamid(e.attributeValue("examid"));

* s.setIdcard(e.attributeValue("idcard"));

* s.setName(e.element("name").getText());

* s.setLocation(e.element("location").getText());

* s.setGrade(Double.parseDouble(e.element("grade").getText()));

* return s; } }

* return null;

}

　　// 删除学生

　　@Test

　　 public void deleteUser(String name) {

　　 try {

　　 Document document = getDocument();

　　 List list = document.selectNodes("//name");

　　Iterator it = list.iterator();

　　// Element nameNode1=(Element) it.next();

　　// System.out.println(nameNode1.getText());

　　 while (it.hasNext()) {

　　Element nameNode = (Element) it.next();

　　String value = nameNode.getText();

　　if (value.equals(name)) {

　　// System.out.println(nameNode.getText());

　　nameNode.getParent().getParent()

　　 .remove(nameNode.getParent());

　　write2Xml(document);

　　 return;

　　 }

　　 throw new RuntimeException("删除失败");

　　} catch (Exception e) {

　　throw new RuntimeException(e);

　　}

　　 // 获得操作xml的对象获得document对象

　　public Document getDocument() throws DocumentException {

　　SAXReader reader = new SAXReader();

　　Document document = reader.read(new File("src//student.xml"));

* 2.解析XML形式的文本,得到document对象.

* String text ="<members></members>";

* Document document =DocumentHelper.parseText(text);

* 3.主动创建document对象.

* Document document =DocumentHelper.createDocument();

* //创建根节点 Element root =document.addElement("members");

　　return document;

　　}

　　 // 将内存中的内容写入xml

　　public void write2Xml(Document document) throws IOException {

　　 //1.文档中全为英文,不设置编码,直接写入的形式

　　XMLWriter writer = new XMLWriter(new FileOutputStream("src//student.xml"));

　　 writer.write(document);

　　 writer.close();

// 2.文档中含有中文,设置编码格式写入的形式

// OutputFormat format = OutputFormat.createPrettyPrint();// 指定XML编码

// format.setEncoding("GBK");

// XMLWriter writer = new XMLWriter(newFileWriter("output.xml"),format);

// writer.write(document);writer.close();

　　 }

　　3、DMO与SAX的区别

　　一、DOM：拉模型，把整个文档加载到内存中
        　　优点：整个文档树在内存中，便于操作；支持删除、修改、重新排列等多种功能；
       　　缺点：将整个文档调入内存（包括无用的节点），浪费时间和空间；
       　　使用场合：一旦解析了文档还需多次访问这些数据；硬件资源充足（内存、CPU）

　　二、SAX：推模型，事件驱动编程，基于回调SAX ，事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时，发送事件，程序员编写响应这些事件的代码，保存数据。
　　　优点：不用事先调入整个文档，占用资源少；

　　　　缺点：不是持久的；事件过后，若没保存数据，那么数据就丢了；无状态性；从事件中只能得到文本，但不知该文本属于哪个元素；

　　　　使用场合：数据量较大的XML文档，占用内存高，机器内存少，无法一次加载XML到内存；只需XML文档的少量内容，很少回头访问；

　　三、JDOM:为减少DOM、SAX的编码量，出现了JDOM；
　　优点：20-80原则，极大减少了代码量，提供常用API减少重复劳动
　使用场合：要实现的功能简单，如解析、创建等Java程序

　　但在底层，JDOM还是使用SAX（最常用）、DOM

性能比较

1）DOM4J性能最好，连Sun的JAXM也在用DOM4J.目前许多开源项目中大量采用DOM4J，例如大名鼎鼎的hibernate也用DOM4J来读取XML配置文件。如果不考虑可移植性，那就采用DOM4J.

2）JDOM和DOM在性能测试时表现不佳，在测试10M文档时内存溢出。在小文档情况下还值得考虑使用DOM和JDOM.虽然JDOM的开发者已经说明他们期望在正式发行版前专注性能问题，

但是从性能观点来看，它确实没有值得推荐之处。另外，DOM仍是一个非常好的选择。DOM实现广泛应用于多种编程语言。它还是许多其它与XML相关的标准的基础，

因为它正式获得W3C推荐（与基于非标准的Java模型相对），所以在某些类型的项目中可能也需要它（如在 JavaScript中使用DOM）。

3）SAX表现较好，这要依赖于它特定的解析方式－事件驱动。一个SAX检测即将到来的XML流，但并没有载入到内存（当然当XML流被读入时，会有部分文档暂时隐藏在内存中）。

posted @ 2019-02-28 17:44 青青子衿J 阅读(1789) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

青青子衿

XML基础+Java解析XML +几种解析方式的性能比较（转载）

一：XML基础

XML是什么:

XML能干什么:

XML与HTML区别：

XML文档节点类型

XML语法

Xml约束

XML DTD 约束

XML Schema 约束

1、为何使用Schema

二、Java解析XML

1、DOM解析

JAXP（DOM解析）

java代码显例：

DOM的基本对象有5个：Document，Node，NodeList，Element和Attr。

Document对象

Node对象

NodeList对象

Element对象

Attr对象

2、SAX解析

StAX 解析

JDOM

DOM4J

代码显例：

3、DMO与SAX的区别

性能比较

公告

　　XML是什么:

　　XML能干什么:

　　XML与HTML区别：

　　XML文档节点类型

　　XML语法

　　Xml约束

　　　　XML DTD 约束

　　XML Schema 约束

　　1、为何使用Schema

　　1、DOM解析

　　JAXP（DOM解析）

　　java代码显例：

　　 Document对象

　　Node对象

　 NodeList对象

　　2、SAX解析

　　StAX 解析

　　JDOM

　　DOM4J

　　代码显例：

　　3、DMO与SAX的区别