DOM方式解析XML文件实例
books.XML文件:
<?xml version="1.0" encoding="utf-8"?>
<bookstore>
<book id="1">
<name>冰与火之歌</name>
<author>乔治马丁</author>
<price>88.0</price>
<year>2014</year>
</book>
<book id="2">
<name>安徒生童话</name>
<price>77.0</price>
<language>English</language>
</book>
</bookstore>
把这个文档放在项目的根路径下,与src目录平行,就可以使用相对路径来引用了。
Java代码部分:
public class DOMTest {
public static void main(String[] args) {
// step 1:获得DOM解析器工厂
// 工厂的作用是创建具体的解析器,即创建一个DocumentBuilderFactory对象
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
try {
// step 2:获得具体的dom解析器 创建一个DocumentBuilder对象
DocumentBuilder db=dbf.newDocumentBuilder();
// step 3:解析一个xml文档,通过Document对象的parse方法加载books.xml文件到当前目录下
Document document=db.parse("books.xml");
//获取所有book节点的集合
NodeList booklist= document.getElementsByTagName("book");
//遍历每一个book节点
// 通过getLength()获取NodeList的长度
for(int i=0;i<booklist.getLength();i++){
System.out.println("下面开始遍历第"+(i+1)+"本书");
// 节点有多个属性时:
//通过item(i)获取bookList的节点值,NodeList索引值从0开始
Node book=booklist.item(i);
//获取book的所有属性
NamedNodeMap attrs= book.getAttributes();
for(int j=0;j<attrs.getLength();j++){
//通过item(index)方法获取book节点的某一个属性
Node attr=attrs.item(j);
//获取属性名
System.out.println("属性名:"+attr.getNodeName());
//获取属性值
System.out.println("属性值:"+attr.getNodeValue());
}
//当知道节点只有一个id属性时:
/*Element attr= (Element) booklist.item(i);
String attributeValue=attr.getAttribute("id");
System.out.println("id属性的属性值为:"+attributeValue);*/
//下面解析book节点的子节点
NodeList childNodes = book.getChildNodes();
System.out.println("第"+(i+1)+"本书共有"+childNodes.getLength()+"个子节点");
//获取每个节点的节点名和节点值
for(int k=0;k<childNodes.getLength();k++){
//区分出text类型的node及element类型的node
if(childNodes.item(k).getNodeType()==Node.ELEMENT_NODE){
//获取了element类型的节点的节点名
System.out.print("第"+(k+1)+"个子节点的节点名称是:"+childNodes.item(k).getNodeName());
//两者之间的区别是Element类型的节点值为空
System.out.println("------"+childNodes.item(k).getFirstChild().getNodeValue());
// System.out.println("------"+childNodes.item(k).getTextContent());
}
}
}
System.out.println("===============循环结束==============");
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
具体过程参见注释。
首先,我们需要建立一个解析器工厂,以利用这个工厂来获得一个具体的解析器对象。
我们在这里使用DocumentBuilderFactory的目的是为了创建与具体解析器无关的程序,当DocumentBuilderFactory类的静态方法newInstance()被调用时,它根据一个系统变量来决定具体使用哪一个解析器。
又因为所有的解析器都服从于JAXP所定义的接口,所以无论具体使用哪一个解析器,代码都是一样的。
所以当在不同的解析器之间进行切换时,值需要更改系统变量的值,而不用更改任何代码。这就是工厂所带来的好处。
当获得一个工厂对象之后,使用它的静态方法newDocumentBuilder(),可以获得一个DocumentBuilder对象。
这个对象代表了具体的DOM解析器。
解析器的具体实现对于程序来说并不重要。
然后,我们就可以利用这个解析器对文档进行解析了。
Sun公司提供了默认的工厂和默认的解析器,上面的例子中就使用了默认的解析器。