Java解析XML文档——dom解析xml

一、前言
  
  用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM。Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。
  
  JAXP接口包含了三个包:
  
  (1)org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。
  
  (2)org.xml.sax  用于对XML进行语法分析的事件驱动的XML简单API(SAX)
  
  (3)javax.xml.parsers解析器工厂工具,程序员获得并配置特殊的特殊语法分析器。
  
  二、前提
  
  DOM编程不要其它的依赖包,因为JDK里自带的JDK里含有的上面提到的org.w3c.dom、org.xml.sax 和javax.xml.parsers包就可以满意条件了。
  
  三、使用DOM解析XML文档
  

  我们现在来看看DOM是如何解析XML的吧!下面是一个简单的XML文件:


F:\book.xml

 

<?xml version="1.0" encoding="gb2312"?>
<books>
 <book author="kok">
  <name>java编程思想</name>
  <price>108</price>
 </book>
</books>

 


基本的根元素、属性、子节点都有,下面用JAVA解析这个XML

package com.donen.test;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class ReadXml {
    
    public static void main(String[] args) throws Exception
    {
        //得到DOM解析器的工厂实例
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        //从DOM工厂获得DOM解析器
        DocumentBuilder db = dbf.newDocumentBuilder();
        /*
         * 解析XML文档的输入流,得到一个Document。有三个常用的重载方法
         * db.parse(File f) 文件
         * db.parse(InputStream is) 流
         * db.parse(String uri) 直接填写网页url 或者 本地文件路径  F:\\book.xml
         */
        Document d = db.parse("F:\\test.xml");
        //得到XML文档的根节点
        Element root = d.getDocumentElement();
        //得到节点
        NodeList nl = root.getChildNodes();
        //得到节点的子节点
        for (int i = 0; i < nl.getLength(); i++) {
            Node book = nl.item(i);
            //轮循子节点
            for (Node node = book.getFirstChild(); node != null; node = node.getNextSibling()) {
                //节点的属性都是为Node.ELEMENT_NODE
                if(node.getNodeType() == Node.ELEMENT_NODE)
                    //DOM把<name>java编程思想</name>也当作是两层结构的节点,其父节点是<name>,子节点java编程思想才是我们真正想得到的。所以去的值使用:book.getFirstChild().getNodeValue()
                    System.out.println(node.getNodeName() + "---" + node.getFirstChild().getNodeValue());
            }
        }
    }
}

 

posted @ 2014-03-20 15:25  koik  阅读(209)  评论(0编辑  收藏  举报