带命名空间的XML的dom4j应用<转>
Element root = document.getRootElement();
List recordenvlist = document.selectNodes("//gml:envelope"); //gml:envelope
提示 NoClassDefFoundError org.dom4j.DocumentFactory.createXPath 原因:dom4j的xpath api依赖jaxen完成解决方法:在系统中加入jaxen.jar.jaxen.jar下载路径:http://jaxen.codehaus.org/releases.htmldom4j-1.6.1.jar下载路http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.jar
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
使用dom4j的xPath解析XML
一般的XML
国外的dom4j已经很流行了,国内的相关资料相对较少,但普及风暴也即将到来。我们公司(老外开的)解析XML就是用的dom4j。
今天公司没事做,自己也写一个小例子贴上来,嘻~~
- books.xml:
- <?xml version="1.0" encoding="UTF-8"?>
- <books>
- <!--This is a test for dom4j, jakoes, 2007.7.19-->
- <book show="yes" url="lucene.net">
- <title id="456">Lucene Studing</title>
- </book>
- <book show="yes" url="dom4j.com">
- <title id="123">Dom4j Tutorials</title>
- </book>
- <book show="no" url="spring.org">
- <title id="789">Spring in Action</title>
- </book>
- <owner>O'Reilly</owner>
- </books>
下面我们使用dom4j的xPath来解析:
- segment of ParseXML.java:
- public void parseBooks(){
- SAXReader reader = new SAXReader();
- try {
- Document doc = reader.read("books.xml");
- Node root = doc.selectSingleNode("/books");
- List list = root.selectNodes("book[@url='dom4j.com']");
- for(Object o:list){
- Element e = (Element) o;
- String show=e.attributeValue("show");
- System.out.println("show = " + show);
- }
- } catch (Exception e) {
- e.printStackTrace();
- }
- }
Document doc = reader.read("books.xml");的意思是加载XML文档,此是可以用doc.asXML()来查看,它将打印整个xml文档。
Node root = doc.selectSingleNode("/books");是读取刚才加载的xml文档内的books节点下的所有内容,对于本例也是整个xml文档。
当然我们也可以加载/books下的某一个节点,如:book节点
Node root = doc.selectSingleNode("/books/book");
或:Node root = doc.selectSingleNode("/books/*");
注意:如果有多个book节点,它只会读取第一个
root.asXML()将打印:
<book show="yes" url="lucene.net">
<title id="456">Lucene Studing</title>
</book>
既然加载了这么多,那我怎么精确的得到我想要的节点呢,别急,看下面:
List list = root.selectNodes("book[@url='dom4j.com']");
它的意思就是读取books节点下的book节点,且book的节点的url属性为dom4j.com
为什么使用list来接收呢,如果有两个book节点,且它们的url属性都为dom4j.com,此时就封闭到list里了。
如果想读取books下的所有book节点,可以这样:
List list = root.selectNodes("book");
如果想读取books节点下的book节点下的title节点,可以这样:
List list2 = root.selectNodes("book[@url='dom4j.com']/title[@id='123']");
注意:selectNodes()参数的格式:
节点名[@属性名='属性值'],如:book[@url='dom4j.com']
如果有多个节点,用“/”分开,如:book[@url='dom4j.com']/title[@id='123']
最近就是读取封闭在List里的内容了,可以用Node来读取,也可以用Element来转换。
attributeValue("属性")是读取该节点的属性值
getText()是读取节点的的内容。
以上载自。。。。sorry不记得了
要注意的是。在dom4j使用selectNodes等操作时要加上另一个包jaxen-1.1.1.jar
带命名空间的XML
在XML根节点出现<outputdatas xmlns="XML">
或<root xmlns="www.xxx.com"> xmlns等于的就是命名空间了
因为dom4j不能识别带命名空间的节点,所以在读取带命名空间的XML时,要在每个节点前加上命名空间,方法如下例子:
- Map nsMap = null;
- @SuppressWarnings("unchecked")
- public void readXml(String xml) throws DocumentException{
- Document doc = DocumentHelper.parseText(xml);
- nsMap = new HashMap();
- String defaultNamespace = doc.getRootElement().getNamespaceURI();
- nsMap.put("default", defaultNamespace);
- //创建解析路径,就是在普通的解析路径前加上map里的key值
- XPath x = doc.createXPath("//default:outputdatas/default:results/"
- + "default:result[@set_id='201']"
- + "/default:row/default:col[@param_id='201001']");
- x.setNamespaceURIs(nsMap);
- List<Node> nodes = x.selectNodes(doc);
- Node node = x.selectSingleNode(doc);
- }
相信聪明的你。。一看就明白啦。。就不用注释啦
转自 http://lovell.iteye.com/blog/625662