Java中对xml的解析

 

Java中对xml的解析

1.Dom4j

Dom解析原理:xml解析器一次性将xml文档加载到内存中,然后在内存中构建一颗Document对象树。在通过Document对象得到树上的节点对象,通过节点对象操作文档内容。

 Dom4J 常用的对象: 

 SAXReader:读取 xml 文件到 Document 树结构文件对象 

 Document:是一个 xml 文档对象树,类比 Html 文档对象。 

 Element:元素节点。通过 Document 对象可以查找单个元素 

 

使用步骤:

导入 Dom4J.jar 包 dom4j-1.6.1.jar )

1.创建SaxReader解析器

          SAXReader Reader = new SAXReader();

2.通过read方法获得Document对象

          Document document = Reader.read("conf/student.xml");
3.获得根节点

  Element rootEle = document.getRootElement();

4.4.通过迭代器遍历xml文档

Iterator it = rootEle.elementIterator();

while (it.hasNext()) {

Element stusEle = (Element) it.next();

Iterator it01 = stusEle.elementIterator();

while (it01.hasNext()) {

Element stuEle = (Element) it01.next();

System.out.println(stuEle.getStringValue());

}

System.out.println("--------------------------------");

}

Dom4j官方文档中有quick start 可以帮助我们快速使用该技术!

 

 

2.SAX

Sax解析工具是sun公司提供的,内至于jdk中。Org.xml.sax.*;

sax解析原理:事件驱动,边读边写

 

当遇到开始标签时,自动调用startElement(String url,String localName,String qname,Attribute attribute)方法;当遇到文本时,自动执行characters(char[]ch,int start,int length);当遇到结束标签时自动执行endElement(String url,String localName,String qName)方法。

<结束标签以’/’作为标志,结束方法比开始方法只少一个attribute 参数>

 

使用步骤:

1.创建解析工厂

//SAXParserFactory 构造方法被保护,只能通过 .newInstance()方法创建实例

SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();

2.创建解析器

//通过工厂创建解析器

SAXParser saxParser = saxParserFactory.newSAXParser();

3.执行parser方法

// 执行 parser 方法,传入两个参数:xml 文件路径、事件处理器 

saxParser.parse("conf/student.xml", new MyDefaultHandler());

所谓事件处理器是指 一个继承与 DefaultHandler 的类,进行重写其中的startElement()characters()endElement()方法实现相应的处理。

 创建一个类,继承 DefaultHander 类,重写三个方法: 

A、 startElement 获取开始标签,重要的两个参数说明 

a、 qName:把标签名称返回 

b、 attributes:返回标签中的属性对象 

B、 character  获取标签文本内容 

C、 endElement  获取结束标签  

 

============DOM解析    vs   SAX解析 ========

DOM解析

SAX解析

原理: 一次性加载xml文档,不适合大容量的文件读取

原理: 加载一点,读取一点,处理一点。适合大容量文件的读取

DOM解析可以任意进行增删改成

SAX解析只能读取

DOM解析任意读取任何位置的数据,甚至往回读

SAX解析只能从上往下,按顺序读取,不能往回读

DOM解析面向对象的编程方法(NodeElementAttribute,Java开发者编码比较简单。

SAX解析基于事件的编程方法。java开发编码相对复杂。

 

3.XPath 

主要是用于快速获取所需的节点对象。

选择节点:XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着

路径或者 step 来选取的。下面列出了最有用的路径表达式: 

表达式 描述 

nodename  选取此节点的所有子节点。 

/  从根节点选取。 

//      从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。 

.  选取当前节点。 

..  选取当前节点的父节点。 

@  选取属性。   

 

text()获取节点的文本内容函数 

使用步骤:

// 1.通过DocumentBuilderFactor创建解析工厂

DocumentBuilderFactory builderFactory = DocumentBuilderFactory

.newInstance();

// 2.通过工厂获得解析器

DocumentBuilder builder = builderFactory.newDocumentBuilder();

// 3.通过parser方法获取Document

Document document = builder.parse("conf/books.xml");

// 4.获取xpath对象

XPath xpath = XPathFactory.newInstance().newXPath();

// 5.获取 bookstore 节点下 book 属性 category 值为 web 下的第二个title 节点的文本内容

String exp = "/bookstore/book[@category='web'][2]/title/text()";

String tit = (String) xpath.evaluate(exp, document,

XPathConstants.STRING);

System.out.println(tit);

// 获取 bookstore 节点下 book 属性 category 值为 web 的 titile 属性为 en 的节点内容

String expEn = "/bookstore/book[@category='web']/title[@lang ='en']/text()";

String titEN = (String) xpath.evaluate(expEn, document,

XPathConstants.STRING);

System.out.println(titEN);

// 获取 bookstore 下 book 属性 category 值为 cooking 的 title 的 lang 属性的值

String expLan = "/bookstore/book[@category='cooking']/title/@lang";

String lang = (String) xpath.evaluate(expLan, document,

XPathConstants.STRING);

System.out.println(lang);

 

// 获取 bookstore 节点下所有 book 的节点集合(遍历该文档)

String expB = "/bookstore/book";

NodeList books =(NodeList) xpath.evaluate(expB, document, XPathConstants.NODESET);

for (int i = 0; i < books.getLength(); i++) {

Element book =(Element) books.item(i);

String title =(String) xpath.evaluate("title/text()", book, XPathConstants.STRING);

String author =(String) xpath.evaluate("author/text()", book, XPathConstants.STRING);

String year =(String) xpath.evaluate("year", book, XPathConstants.STRING);

String price =(String) xpath.evaluate("price", book, XPathConstants.STRING);

System.out.println(title+" "+author+" "+year+" "+price);

System.out.println("----------------------------------------------------");

}

 

4.在Dom4j中使用XPath

开发中Dom4jXPath结合使用非常灵活,所以应用广泛!

使用步骤:

1)导入xPath支持jar包 。  jaxen-1.1-beta-6.jar

2)使用xpath方法

List<Node>  selectNodes("xpath表达式");   查询多个节点对象

Node       selectSingleNode("xpath表达式");  查询一个节点对象

                //1.SAXReader解析器

SAXReader reader = new SAXReader();

//2.通过read方法获得Document

Document document =reader.read("conf/bookstore.xml");

//3.xpath路劲

String titlePath ="/bookstore/book[1]/title";

Element element  =(Element) document.selectObject(titlePath);

String title =element.getStringValue();

System.out.println(title);

posted @ 2016-09-11 08:01  鹤少  阅读(1820)  评论(0编辑  收藏  举报