java利用dom4j对任意xml的解析
最近完成了java对任意对象生成xml,有写了下java对任意一个xml文件的解析,生成主要靠反射原理来完成,而解析则主要是遍历xml树的每个节点,并对每个节点进行处理。刚刚开始我写了个如下的解析文件。
package javaForXML;
imp
imp
imp
imp
imp
imp
imp
imp
imp
imp
imp
/**
* 利用dom4j进行XML解析
* 没用递归,本类只能解析到两层嵌套的属性和值
* @date Dec 25, 20094:43:47 PM
* @author zhangjp
* @param
*/
public class PraseXMLTest5 {
/**
* 遍历每个节点和属性
* @param filename
* @returnPraseXMLTest5.java
*/
public static List<Map<String,String>> iterateWholeXML(String filename) {
List <Map<String,String>>list = new ArrayList<Map<String,String>>();
SAXReader saxReader = new SAXReader();
try {
Document document = saxReader.read(new File(filename));
Element root = document.getRootElement();
// 遍历根结点的所有孩子节点
for (Iterator iter = root.elementIterator(); iter.hasNext();) {
HashMap<String, String> map = new HashMap<String, String>();
Element element = (Element) iter.next();
if (element == null)
continue;
// 获取属性和它的值
for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {
Attribute attr = (Attribute) attrs.next();
if (attr == null)
continue;
String attrName = attr.getName();
String attrValue = attr.getValue();
map.put(attrName, attrValue);
}
if(element.isTextOnly()){
String elementName = element.getName();
String elementValue = element.getText();
map.put(elementName, elementValue);
}else{
// 遍历结点的所有孩子节点,并进行处理
for (Iterator iterInner = element.elementIterator(); iterInner.hasNext();) {
Element elementInner = (Element) iterInner.next();
//如果没有孩子结点,则直接取值
if (elementInner == null){
String elementName = element.getName();
String elementValue = element.getText();
map.put(elementName, elementValue);
}
//孩子结点的属性
for(Iterator innerAttrs = elementInner.attributeIterator();innerAttrs.hasNext();){
Attribute innerAttr = (Attribute)innerAttrs.next();
if(innerAttr == null)
continue;
String innerAttrName = innerAttr.getName();
String innerAttrValue = innerAttr.getValue();
map.put(innerAttrName, innerAttrValue);
}
//假定没有第三层嵌套,获得第二层的值
String innerName = elementInner.getName();
String innerValue = elementInner.getText();
map.put(innerName, innerValue);
}
}
list.add(map);
}
return list;
} catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return null;
}
/**
* 测试
* @param args
* @throws DocumentExceptionPraseXMLTest5.java
*/
public static void main(String[] args) throws DocumentException {
String filename = "d:\\da
List<Map<String,String>> list = PraseXMLTest5.iterateWholeXML(filename);
for(Map <String,String>map:list){
for (String ss : map.keySet()) {
System.out.println(ss + ":" + map.get(ss));
}
}
}
}
这个写的很累,具体说很累赘,而且只能遍历xml的两层嵌套,对三层或更多的嵌套无能无力。于是很明显的看到这里用一个递归式多么容易的事情。于是写了下面这个代码:
package javaForXML;
imp
imp
imp
imp
imp
imp
imp
imp
imp
imp
imp
/**
* 利用dom4j进行XML解析
* 利用递归,本类对所有嵌套进行递归遍历
* @date Dec 25, 20094:43:47 PM
* @author zhangjp
* @param
*/
public class PraseXMLTest6 {
/**
* 遍历每个节点和属性
* @param filename
* @returnPraseXMLTest5.java
*/
public static List<Map<String,String>> iterateWholeXML(String filename) {
List <Map<String,String>>list = new ArrayList<Map<String,String>>();
SAXReader saxReader = new SAXReader();
try {
Document document = saxReader.read(new File(filename));
Element root = document.getRootElement();
recursiveNode(root,list);
return list;
} catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return null;
}
/**
* 递归遍历所有的节点获得对应的值
* @param rootPraseXMLTest6.java
*/
private static void recursiveNode(Element root,List <Map<String,String>>list ){
// 遍历根结点的所有孩子节点
for (Iterator iter = root.elementIterator(); iter.hasNext();) {
HashMap<String, String> map = new HashMap<String, String>();
Element element = (Element) iter.next();
if (element == null)
continue;
// 获取属性和它的值
for (Iterator attrs = element.attributeIterator(); attrs.hasNext();) {
Attribute attr = (Attribute) attrs.next();
if (attr == null)
continue;
String attrName = attr.getName();
String attrValue = attr.getValue();
map.put(attrName, attrValue);
}
//如果有PCDATA,则直接提出
if(element.isTextOnly()){
String innerName = element.getName();
String innerValue = element.getText();
map.put(innerName, innerValue);
list.add(map);
}else{
list.add(map);
//递归调用
recursiveNode(element ,list);
}
}
}
/**
* 测试
* @param args
* @throws DocumentExceptionPraseXMLTest5.java
*/
public static void main(String[] args) throws DocumentException {
String filename = "d:\\zhang.xml";
List<Map<String,String>> list = PraseXMLTest6.iterateWholeXML(filename);
for(Map <String,String>map:list){
for (String ss : map.keySet()) {
System.out.println(ss + ":" + map.get(ss));
}
}
}
}
用了递归后,节省很多代码。看起来也比较简单明了,最大的好处是对于任意多个嵌套的xml文件的解析都不在话下。
以上解析构造Document的时候都是文件,而在实际使用中很多情况不是来自文件,而是来自一个String,那么需要DocumentHelper这个类,如以下处理方法:
Document document=DocumentHelper.parseText(xml);
Element root = document.getRootElement();
呵呵 ~ 好了 ,这个解析比生成要简单的多,好好悟吧。