java利用dom4j对任意xml的解析

             最近完成了java对任意对象生成xml,有写了下java对任意一个xml文件的解析,生成主要靠反射原理来完成,而解析则主要是遍历xml树的每个节点,并对每个节点进行处理。刚刚开始我写了个如下的解析文件。

 

package javaForXML;

import java.io.File;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.List;
import java.util.Map;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

/**
 * 利用dom4j进行XML解析
 * 没用递归,本类只能解析到两层嵌套的属性和值
 * @date Dec 25, 20094:43:47 PM
 * @author zhangjp
 * @param
 */
public class PraseXMLTest5 {
   
    /**
     * 遍历每个节点和属性
     * @param filename
     * @returnPraseXMLTest5.java
     */
 public  static  List<Map<String,String>> iterateWholeXML(String filename) {
 
  List <Map<String,String>>list = new ArrayList<Map<String,String>>();
  SAXReader saxReader = new SAXReader();
 
   try {
    Document document = saxReader.read(new File(filename));
    Element root = document.getRootElement();

    // 遍历根结点的所有孩子节点
    for (Iterator iter = root.elementIterator(); iter.hasNext();) {
     HashMap<String, String> map = new HashMap<String, String>();

     Element element = (Element) iter.next();
     if (element == null)
      continue;
     // 获取属性和它的值
     for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {
      Attribute attr = (Attribute) attrs.next();
      if (attr == null)
       continue;
      String attrName = attr.getName();
      String attrValue = attr.getValue();

      map.put(attrName, attrValue);
     }
     if(element.isTextOnly()){
      String elementName = element.getName();
      String elementValue = element.getText();
      map.put(elementName, elementValue);
     }else{
     // 遍历结点的所有孩子节点,并进行处理
     for (Iterator iterInner = element.elementIterator(); iterInner.hasNext();) {
       Element elementInner = (Element) iterInner.next();
       //如果没有孩子结点,则直接取值
       if (elementInner == null){
        String elementName = element.getName();
        String elementValue = element.getText();
        map.put(elementName, elementValue);
       }
        
       //孩子结点的属性
       for(Iterator innerAttrs = elementInner.attributeIterator();innerAttrs.hasNext();){
        Attribute innerAttr = (Attribute)innerAttrs.next();
        if(innerAttr == null)
         continue;
        String innerAttrName = innerAttr.getName();
        String innerAttrValue = innerAttr.getValue();
        map.put(innerAttrName, innerAttrValue);
       }
       //假定没有第三层嵌套,获得第二层的值
       String innerName = elementInner.getName();
       String innerValue = elementInner.getText();
       map.put(innerName, innerValue);
      
      }
     
     }
     list.add(map);
    }
       return list;
   } catch (DocumentException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
   }
   return null;
 
 }
   

 /**
  * 测试
  * @param args
  * @throws DocumentExceptionPraseXMLTest5.java
  */
 public static void main(String[] args) throws DocumentException {
  String filename = "d:\\data.xml";
  List<Map<String,String>> list = PraseXMLTest5.iterateWholeXML(filename);
  for(Map <String,String>map:list){
  for (String ss : map.keySet()) {
   System.out.println(ss + ":" + map.get(ss));
  }
  }
 }
}

 

这个写的很累,具体说很累赘,而且只能遍历xml的两层嵌套,对三层或更多的嵌套无能无力。于是很明显的看到这里用一个递归式多么容易的事情。于是写了下面这个代码:

 

package javaForXML;

import java.io.File;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.List;
import java.util.Map;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

/**
 * 利用dom4j进行XML解析
 * 利用递归,本类对所有嵌套进行递归遍历
 * @date Dec 25, 20094:43:47 PM
 * @author zhangjp
 * @param
 */
public class PraseXMLTest6 {
   
    /**
     * 遍历每个节点和属性
     * @param filename
     * @returnPraseXMLTest5.java
     */
 public  static  List<Map<String,String>> iterateWholeXML(String filename) {
 
  List <Map<String,String>>list = new ArrayList<Map<String,String>>();
  SAXReader saxReader = new SAXReader();
 
   try {
    Document document = saxReader.read(new File(filename));
    Element root = document.getRootElement();
    recursiveNode(root,list);
       return list;
   } catch (DocumentException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
   }
   return null;
 
 }
   
 /**
  * 递归遍历所有的节点获得对应的值
  * @param rootPraseXMLTest6.java
  */
 private static void recursiveNode(Element root,List <Map<String,String>>list ){
  // 遍历根结点的所有孩子节点
  for (Iterator iter = root.elementIterator(); iter.hasNext();) {
   HashMap<String, String> map = new HashMap<String, String>();

   Element element = (Element) iter.next();
   if (element == null)
    continue;
   // 获取属性和它的值
   for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {
    Attribute attr = (Attribute) attrs.next();
    if (attr == null)
     continue;
    String attrName = attr.getName();
    String attrValue = attr.getValue();

    map.put(attrName, attrValue);
   }
   //如果有PCDATA,则直接提出
   if(element.isTextOnly()){
    String innerName = element.getName();
    String innerValue = element.getText();
    map.put(innerName, innerValue);
     list.add(map);
   }else{
     list.add(map);
        //递归调用
           recursiveNode(element ,list);   
   }

  }
 }

 /**
  * 测试
  * @param args
  * @throws DocumentExceptionPraseXMLTest5.java
  */
 public static void main(String[] args) throws DocumentException {
  String filename = "d:\\zhang.xml";
  List<Map<String,String>> list = PraseXMLTest6.iterateWholeXML(filename);
  for(Map <String,String>map:list){
  for (String ss : map.keySet()) {
   System.out.println(ss + ":" + map.get(ss));
  }
  }
 }
}

 

 

 
        用了递归后,节省很多代码。看起来也比较简单明了,最大的好处是对于任意多个嵌套的xml文件的解析都不在话下。

        以上解析构造Document的时候都是文件,而在实际使用中很多情况不是来自文件,而是来自一个String,那么需要DocumentHelper这个类,如以下处理方法:

     Document document=DocumentHelper.parseText(xml);
     Element root = document.getRootElement();

呵呵 ~ 好了 ,这个解析比生成要简单的多,好好悟吧。

posted @ 2013-08-23 13:54  alaricblog  阅读(208)  评论(0编辑  收藏  举报