DOM方式解析XML文件实例

books.XML文件:

<?xml version="1.0" encoding="utf-8"?>
<bookstore>
    <book id="1">
        <name>冰与火之歌</name>
        <author>乔治马丁</author>
        <price>88.0</price>
        <year>2014</year>
    </book>
    <book id="2">
        <name>安徒生童话</name>
        <price>77.0</price>
        <language>English</language>
    </book>
</bookstore>

把这个文档放在项目的根路径下,与src目录平行,就可以使用相对路径来引用了。

 

Java代码部分:

 

 public class DOMTest {
    public static void main(String[] args) {

 

   // step 1:获得DOM解析器工厂

 

   // 工厂的作用是创建具体的解析器,即创建一个DocumentBuilderFactory对象
        
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
        try {
            // step 2:获得具体的dom解析器   创建一个DocumentBuilder对象
            DocumentBuilder db=dbf.newDocumentBuilder();
            // step 3:解析一个xml文档,通过Document对象的parse方法加载books.xml文件到当前目录下
            Document document=db.parse("books.xml");
            //获取所有book节点的集合
            NodeList booklist= document.getElementsByTagName("book");
            //遍历每一个book节点
           //  通过getLength()获取NodeList的长度
            for(int i=0;i<booklist.getLength();i++){
                System.out.println("下面开始遍历第"+(i+1)+"本书");
            //    节点有多个属性时:
                //通过item(i)获取bookList的节点值,NodeList索引值从0开始
                Node book=booklist.item(i);
                //获取book的所有属性
                NamedNodeMap attrs= book.getAttributes();
                for(int j=0;j<attrs.getLength();j++){
                    //通过item(index)方法获取book节点的某一个属性
                  
 Node attr=attrs.item(j);
                    //获取属性名
                    System.out.println("属性名:"+attr.getNodeName());
                    //获取属性值
                    System.out.println("属性值:"+attr.getNodeValue());
                }
                //当知道节点只有一个id属性时:
                /*Element attr= (Element) booklist.item(i);
                String attributeValue=attr.getAttribute("id");
                System.out.println("id属性的属性值为:"+attributeValue);*/
                
                //下面解析book节点的子节点
                NodeList childNodes = book.getChildNodes();
                System.out.println("第"+(i+1)+"本书共有"+childNodes.getLength()+"个子节点");
                //获取每个节点的节点名和节点值
                for(int k=0;k<childNodes.getLength();k++){
                    //区分出text类型的node及element类型的node
                    if(childNodes.item(k).getNodeType()==Node.ELEMENT_NODE){
                        //获取了element类型的节点的节点名
                        System.out.print("第"+(k+1)+"个子节点的节点名称是:"+childNodes.item(k).getNodeName());
                        //两者之间的区别是Element类型的节点值为空
                        System.out.println("------"+childNodes.item(k).getFirstChild().getNodeValue());
                  //   System.out.println("------"+childNodes.item(k).getTextContent());
                    }
                }
            }
            System.out.println("===============循环结束==============");
        } catch (ParserConfigurationException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }catch (SAXException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
}

具体过程参见注释。

首先,我们需要建立一个解析器工厂,以利用这个工厂来获得一个具体的解析器对象。 

       我们在这里使用DocumentBuilderFactory的目的是为了创建与具体解析器无关的程序,当DocumentBuilderFactory类的静态方法newInstance()被调用时,它根据一个系统变量来决定具体使用哪一个解析器。

      又因为所有的解析器都服从于JAXP所定义的接口,所以无论具体使用哪一个解析器,代码都是一样的。

  所以当在不同的解析器之间进行切换时,值需要更改系统变量的值,而不用更改任何代码。这就是工厂所带来的好处。

      当获得一个工厂对象之后,使用它的静态方法newDocumentBuilder(),可以获得一个DocumentBuilder对象

  这个对象代表了具体的DOM解析器。

  解析器的具体实现对于程序来说并不重要。  

  然后,我们就可以利用这个解析器对文档进行解析了。

  Sun公司提供了默认的工厂和默认的解析器,上面的例子中就使用了默认的解析器。

 

posted @ 2015-07-08 14:39  aa6055  阅读(477)  评论(0编辑  收藏  举报