Java解析XML文档——dom解析xml
一、前言
用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM。Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。
JAXP接口包含了三个包:
(1)org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。
(2)org.xml.sax 用于对XML进行语法分析的事件驱动的XML简单API(SAX)
(3)javax.xml.parsers解析器工厂工具,程序员获得并配置特殊的特殊语法分析器。
二、前提
DOM编程不要其它的依赖包,因为JDK里自带的JDK里含有的上面提到的org.w3c.dom、org.xml.sax 和javax.xml.parsers包就可以满意条件了。
三、使用DOM解析XML文档
我们现在来看看DOM是如何解析XML的吧!下面是一个简单的XML文件:
F:\book.xml
<?xml version="1.0" encoding="gb2312"?> <books> <book author="kok"> <name>java编程思想</name> <price>108</price> </book> </books>
基本的根元素、属性、子节点都有,下面用JAVA解析这个XML
package com.donen.test; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; public class ReadXml { public static void main(String[] args) throws Exception { //得到DOM解析器的工厂实例 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); //从DOM工厂获得DOM解析器 DocumentBuilder db = dbf.newDocumentBuilder(); /* * 解析XML文档的输入流,得到一个Document。有三个常用的重载方法 * db.parse(File f) 文件 * db.parse(InputStream is) 流 * db.parse(String uri) 直接填写网页url 或者 本地文件路径 F:\\book.xml */ Document d = db.parse("F:\\test.xml"); //得到XML文档的根节点 Element root = d.getDocumentElement(); //得到节点 NodeList nl = root.getChildNodes(); //得到节点的子节点 for (int i = 0; i < nl.getLength(); i++) { Node book = nl.item(i); //轮循子节点 for (Node node = book.getFirstChild(); node != null; node = node.getNextSibling()) { //节点的属性都是为Node.ELEMENT_NODE if(node.getNodeType() == Node.ELEMENT_NODE) //DOM把<name>java编程思想</name>也当作是两层结构的节点,其父节点是<name>,子节点java编程思想才是我们真正想得到的。所以去的值使用:book.getFirstChild().getNodeValue() System.out.println(node.getNodeName() + "---" + node.getFirstChild().getNodeValue()); } } } }