dom4j解析xml
与利用DOM、SAX、JAXP机制来解析xml相比,DOM4J 表现更优秀,具有性能优异、功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。dom4j是一套开源的api。实际项目中,往往选择dom4j来作为解析xml的利器。
先来看看dom4j中对应XML的DOM树建立的继承关系

针对于XML标准定义,对应于图2-1列出的内容,dom4j提供了以下实现:
同时,dom4j的NodeType枚举实现了XML规范中定义的node类型。如此可以在遍历xml文档的时候通过常量来判断节点类型了。
常用API
class org.dom4j.io.SAXReader
- read 提供多种读取xml文件的方式,返回一个Domcument对象
interface org.dom4j.Document
- iterator 使用此法获取node
- getRootElement 获取根节点
interface org.dom4j.Node
- getName 获取node名字,例如获取根节点名称为bookstore
- getNodeType 获取node类型常量值,例如获取到bookstore类型为1——Element
- getNodeTypeName 获取node类型名称,例如获取到的bookstore类型名称为Element
interface org.dom4j.Element
- attributes 返回该元素的属性列表
- attributeValue 根据传入的属性名获取属性值
- elementIterator 返回包含子元素的迭代器
- elements 返回包含子元素的列表
interface org.dom4j.Attribute
- getName 获取属性名
- getValue 获取属性值
interface org.dom4j.Text
- getText 获取Text节点值
interface org.dom4j.CDATA
- getText 获取CDATA Section值
interface org.dom4j.Comment
- getText 获取注释
解析xml字符串:
<?xml version="1.0" encoding="UTF-8"?> <java version="1.7.0_79" class="java.beans.XMLDecoder"> <object class="java.util.HashMap"> <void method="put"> <string>fd_id</string> <string>123456</string> </void> <void method="put"> <string>fd_name</string> <string>LT</string> </void> <void method="put"> <string>fd_sex</string> <string></string> </void> <void method="put"> <string>fd_remark</string> <null/> </void> </object> </java>
import java.util.HashMap; import java.util.Iterator; import java.util.List; import org.dom4j.Document; import org.dom4j.DocumentHelper; import org.dom4j.Element; public class XMLHelper { /** * 读取XML数据 */ public HashMap<String,String> parseXMLString(String xml) throws Exception{ Document doc = null; HashMap<String,String> map = new HashMap<String,String>(); try{ /* * 读取并解析XML文档 * SAXReader就是一个管道,用一个流的方式,把xml文件读出来 * SAXReader reader = new SAXReader(); * xxx.xml表示你要解析的xml文档 * Document document = reader.read(new File("xxx.xml")); */ doc = DocumentHelper.parseText(xml);//将字符串转为XML Element rootElt = doc.getRootElement();//获取根节点java Iterator iterObj = rootElt.elementIterator("object");//获取根节点下的子节点object Element eleObj = (Element) iterObj.next(); Iterator iterV = eleObj.elementIterator("void");//拿到object节点下的子节点void //遍历void节点 while(iterV.hasNext()){ Element eleV = (Element) iterV.next(); List<Element> eleS = eleV.elements(); String key = eleS.get(0).getText(); String value = eleS.get(1).getText(); map.put(key, value); } }catch(Exception e){ e.printStackTrace(); } return map; } }
解析xml文件:
/** * 解析包含有DB连接信息的XML文件 * 格式必须符合如下规范: * 1. 最多三级,每级的node名称自定义; * 2. 二级节点支持节点属性,属性将被视作子节点; * 3. CDATA必须包含在节点中,不能单独出现。 * * 示例1——三级显示: * <db-connections> * <connection> * <name>DBTest</name> * <jndi></jndi> * <url> * <![CDATA[jdbc:mysql://localhost:3306/db_test?useUnicode=true&characterEncoding=UTF8]]> * </url> * <driver>org.gjt.mm.mysql.Driver</driver> * <user>test</user> * <password>test2012</password> * <max-active>10</max-active> * <max-idle>10</max-idle> * <min-idle>2</min-idle> * <max-wait>10</max-wait> * <validation-query>SELECT 1+1</validation-query> * </connection> * </db-connections> * * 示例2——节点属性: * <bookstore> * <book category="cooking"> * <title lang="en">Everyday Italian</title> * <author>Giada De Laurentiis</author> * <year>2005</year> * <price>30.00</price> * </book> * * <book category="children" title="Harry Potter" author="J K. Rowling" year="2005" price="$29.9"/> * </bookstore>
* * @param configFile * @return * @throws Exception */ public static List<Map<String, String>> parseDBXML(String configFile) throws Exception { List<Map<String, String>> dbConnections = new ArrayList<Map<String, String>>(); InputStream is = Parser.class.getResourceAsStream(configFile); SAXReader saxReader = new SAXReader(); Document document = saxReader.read(is); Element connections = document.getRootElement(); Iterator<Element> rootIter = connections.elementIterator(); while (rootIter.hasNext()) { Element connection = rootIter.next(); Iterator<Element> childIter = connection.elementIterator(); Map<String, String> connectionInfo = new HashMap<String, String>(); List<Attribute> attributes = connection.attributes(); for (int i = 0; i < attributes.size(); ++i) { // 添加节点属性 connectionInfo.put(attributes.get(i).getName(), attributes.get(i).getValue()); } while (childIter.hasNext()) { // 添加子节点 Element attr = childIter.next(); connectionInfo.put(attr.getName().trim(), attr.getText().trim()); } dbConnections.add(connectionInfo); } return dbConnections; }
转载自:https://www.cnblogs.com/superjt/p/3310307.html

浙公网安备 33010602011771号