Java编程中应用dom4j轻松地处理XML文档

 

dom4j是Java平台中一个简单易用的XML处理工具,它使用的是Java的Collections架构,提供了对DOM,SAX,JAXP的完整支持。

1.创建新的XML文档

 

<ccid_nobr>
<ccid_code>import org.dom4j.Document; 
import org.dom4j.DocumentHelper; 
import org.dom4j.Element; 

public class Users { 

public Document createDocument() { 
Document document = DocumentHelper.createDocument(); 
Element root = document.addElement( "users" ); 

Element me = root.addElement( "user" ) 
.addAttribute( "userid", "sucode" ) 
.addAttribute( "username", "Eric Yu" ) 
.addText( "myself" ); 

Element me = root.addElement( "user" ) 
.addAttribute( "userid", "scottl" ) 
.addAttribute( "username", "Scott Long" ) 
.addText( "FreeBSD leader" ); 

return document; 
} 
}

以上代码创建了如下的XML文档:

 

<ccid_nobr>
<ccid_code><users> 
<user userid="sucode" username="Eric Yu">myself</user> 
<user userid="scottl" username="Scott Long">FreeBSD leader</user> 
</users>

2.XML文档与字符串之间的相互转换

个人比较喜欢的一个dom4j特性就是它提供了非常简便的方法将XML文档转换为XML格式的字符串。由于Document,Element,Attribute都继承了Node接口,所以他们都提供了asXML()方法,该方法返回节点的XML格式描述。

Document document = (new Users()).createDocument();

String text = document.asXML();

而将XML字符串转换为Document同样非常简便:

Document doc = DocumentHelper.parseText(text);

3.快速遍历

如果需要处理很大的XML文档,为每个循环创建一个Iterator对象将带来很大的开销。这时候推荐使用快速遍历(fast Looping):

 

<ccid_nobr>
<ccid_code>public void treeWalk(Document document) { 
treeWalk( document.getRootElement() ); 
} 

public void treeWalk(Element element) { 
for ( int i = 0, size = element.nodeCount(); i < size; i++ ) { 
Node node = element.node(i); 
if ( node instanceof Element ) { 
treeWalk( (Element) node ); 
} 
else { 
// 具体业务代码 
} 
} 
}

4.使用XPath

在dom4j中,XPath可以作用在文档或任何节点上。

 

<ccid_nobr>
<ccid_code>// 返回users下的所有user节点 
List userlist = document.selectNodes("//users/user"); 
//返回users下的userid为sucode的user节点 
User me = (Element)document.selectSingleNode("//users/user[@userid=&#39;sucode&#39;]");

selectSingleNode返回符合条件的第一个节点,如果有多个节点匹配,后面的节点将被忽略

5.将XML文档写入文件

我们经常要将XML文档以文件的形式保存。dom4j为XML文档写入文件系统提供了非常直观的方法:

FileWriter out = new FileWriter("users.xml");

document.write(out);

还可以通过XMLWriter指定输出时的格式:

 

<ccid_nobr>
<ccid_code>import org.dom4j.Document; 
import org.dom4j.io.OutputFormat; 
import org.dom4j.io.XMLWriter; 

public class DOMTest { 

public void write(Document document) throws IOException { 
// 创建XMLWriter对象,目标文件users.xml,使用PrettyPrint格式 
XMLWriter writer = new XMLWriter(new FileWriter("users.xml"), 
OutputFormat.createPrettyPrint()); 
// 写文档 
writer.write(document); 
// 关闭writer 
writer.close(); 
} 
}
posted @ 2013-01-07 22:43  金鳞岂是池中物  阅读(281)  评论(0编辑  收藏  举报