信息时代的生存哲学

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

Java有多种方法可以分析XML文档,你可以选择现在已经成熟的标准技术,比如DOM和SAX,或者你可以选择专用于处理XML的Java API (Java API for XML Processing,JAXP)。

<a href="http://ad.cn.doubleclick.net/click%3Bh=v3|3190|3|0|%2a|o%3B10794752%3B0-0%3B0%3B6694709%3B31-1|1%3B6858800|6876696|1%3B%3B%7Esscs%3D%3fhttp%3a%2f%2fhttp://www.cisco.com/cn/power/security/?&pnBAC=BAC-1249" target="_blank"><IMG SRC="http://m2.cn.doubleclick.net/929995/Cisco_mpu_0916final.swf " WIDTH=468 HEIGHT=60 BORDER=0 ></a>

JAXP是一种专门提供XML文档解析的Java接口,下面我们就来研究一下如何使用Apache Xerces-2 解析器来实现JAXP。

工厂模式

JAXP提供了一种DOM及SAX方式的解析器来处理XML文档,也就是工厂模式。你选择不同的工厂类就会有不同的处理方法。工厂类实际上是一个标准设计模式,你可以根据需要自行修改。

利用JAXP,你可以使用DocumentBuilderFactory来建立自己的DocumentBuilder类,或者使用SAXParserFactory来建立自己的SAXParser类。不同之处就在于DOM解析器是将整个文档读入内存并允许你以随机方式读取文档,而SAX解析器是通过呼叫句柄来解释XML文档数据的。下面我们仔细研究一下DocumentBuilder类。

DocumentBuilder类

通过在DocumentBuilderFactory类中呼叫newDocumentBuilder方法,我们可以建立一个DocumentBuilder类。你可以通过呼叫newInstance方法来建立多个DocumentBuilderFactory类。

例如,你可以这样建立一个新的DocumentBuilderFactory类:

DocumentBuilderFactorydbfactory = DocumentBuilderFactory.newInstance();

一旦有了工厂类的句柄,你就可以马上建立一个DOM解析器的实例了。下面是建立代码:

DocumentBuilder builder = dbfactory. newDocumentBuilder();

这样我们就建立了一个真正的DocumentBuilder类的实例。为了解析文档,你必须调用DocumentBuilder类的解析方法。解析方法会返回一个Document对象,就是你要操作的XML文档。

Listing A实现了一个简单的利用DocumentBuilderFactory和DocumentBuilder类的方法:

Listing A:

JAXPSample.java
import javax.xml.parsers.*;
import org.w3c.dom.*;

public class JAXPSample {

  public static void main(String[] args) {
    String filename = "sample.xml";
         
    try {
      DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
      DocumentBuilder parser = factory.newDocumentBuilder();
      Document d = parser.parse(filename);
    }
    catch (Exception e) {
      System.err.println("Exception: " + e.getMessage());
    }
  
  }
}

DocumentBuilder类其实就是一个DOM解析器。利用JAXP的DocumentBuilder类的优势就在于它比其他XML解析器更轻便。

真实的文档

当通过DocumentBuilder接口使用DOM时,解析器会返回一个Document类。这个Document类很重要,因为它是完全符合W3C标准的,这意味这你可以将这个Document类和其他DOM解析器良好的结合起来。

例如你可以通过以下代码找回元素值:

String getXMLValue(Document doc, String name) {     
     NodeListnlist=doc.getElementsByTagName(name);
     String value = nlist.item(0).getFirstChild().getNodeValue();
     return value;
}

这个方法用来寻找文档内与字符串一致的子节点。

posted on 2004-09-24 11:08  信息时代的生存哲学  阅读(291)  评论(0编辑  收藏  举报