dom4j解析xml字符串实例
DOM4J
与利用DOM、SAX、JAXP机制来解析xml相比,DOM4J 表现更优秀,具有性能优异、功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。dom4j是一套开源的api。实际项目中,往往选择dom4j来作为解析xml的利器。
先来看看dom4j中对应XML的DOM树建立的继承关系
针对于XML标准定义,对应于图2-1列出的内容,dom4j提供了以下实现:
同时,dom4j的NodeType枚举实现了XML规范中定义的node类型。如此可以在遍历xml文档的时候通过常量来判断节点类型了。
常用API
class org.dom4j.io.SAXReader
- read 提供多种读取xml文件的方式,返回一个Domcument对象
interface org.dom4j.Document
- iterator 使用此法获取node
- getRootElement 获取根节点
interface org.dom4j.Node
- getName 获取node名字,例如获取根节点名称为bookstore
- getNodeType 获取node类型常量值,例如获取到bookstore类型为1——Element
- getNodeTypeName 获取node类型名称,例如获取到的bookstore类型名称为Element
interface org.dom4j.Element
- attributes 返回该元素的属性列表
- attributeValue 根据传入的属性名获取属性值
- elementIterator 返回包含子元素的迭代器
- elements 返回包含子元素的列表
interface org.dom4j.Attribute
- getName 获取属性名
- getValue 获取属性值
interface org.dom4j.Text
- getText 获取Text节点值
interface org.dom4j.CDATA
- getText 获取CDATA Section值
interface org.dom4j.Comment
- getText 获取注释
例一:
1 //先加入dom4j.jar包 2 import java.util.HashMap; 3 import java.util.Iterator; 4 import java.util.Map; 5 6 import org.dom4j.Document; 7 import org.dom4j.DocumentException; 8 import org.dom4j.DocumentHelper; 9 import org.dom4j.Element; 10 11 12 public class TestDom4j { 13 14 public void readStringXml(String xml) { 15 Document doc = null; 16 try { 17 18 // 读取并解析XML文档 19 // SAXReader就是一个管道,用一个流的方式,把xml文件读出来 20 // 21 // SAXReader reader = new SAXReader(); //User.hbm.xml表示你要解析的xml文档 22 // Document document = reader.read(new File("User.hbm.xml")); 23 // 下面的是通过解析xml字符串的 24 doc = DocumentHelper.parseText(xml); // 将字符串转为XML 25 26 Element rootElt = doc.getRootElement(); // 获取根节点 27 System.out.println("根节点:" + rootElt.getName()); // 拿到根节点的名称 28 29 Iterator iter = rootElt.elementIterator("head"); // 获取根节点下的子节点head 30 31 // 遍历head节点 32 while (iter.hasNext()) { 33 34 Element recordEle = (Element) iter.next(); 35 String title = recordEle.elementTextTrim("title"); // 拿到head节点下的子节点title值 36 System.out.println("title:" + title); 37 38 Iterator iters = recordEle.elementIterator("script"); // 获取子节点head下的子节点script 39 40 // 遍历Header节点下的script节点 41 while (iters.hasNext()) { 42 43 Element itemEle = (Element) iters.next(); 44 45 String username = itemEle.elementTextTrim("username"); // 拿到head下的子节点script下的字节点username的值 46 String password = itemEle.elementTextTrim("password"); 47 48 System.out.println("username:" + username); 49 System.out.println("password:" + password); 50 } 51 } 52 Iterator iterss = rootElt.elementIterator("body"); ///获取根节点下的子节点body 53 // 遍历body节点 54 while (iterss.hasNext()) { 55 56 Element recordEless = (Element) iterss.next(); 57 String result = recordEless.elementTextTrim("result"); // 拿到body节点下的子节点result值 58 System.out.println("result:" + result); 59 60 Iterator itersElIterator = recordEless.elementIterator("form"); // 获取子节点body下的子节点form 61 // 遍历Header节点下的form节点 62 while (itersElIterator.hasNext()) { 63 64 Element itemEle = (Element) itersElIterator.next(); 65 66 String banlce = itemEle.elementTextTrim("banlce"); // 拿到body下的子节点form下的字节点banlce的值 67 String subID = itemEle.elementTextTrim("subID"); 68 69 System.out.println("banlce:" + banlce); 70 System.out.println("subID:" + subID); 71 } 72 } 73 } catch (DocumentException e) { 74 e.printStackTrace(); 75 76 } catch (Exception e) { 77 e.printStackTrace(); 78 79 } 80 } 81 82 /** 83 * @description 将xml字符串转换成map 84 * @param xml 85 * @return Map 86 */ 87 public static Map readStringXmlOut(String xml) { 88 Map map = new HashMap(); 89 Document doc = null; 90 try { 91 // 将字符串转为XML 92 doc = DocumentHelper.parseText(xml); 93 // 获取根节点 94 Element rootElt = doc.getRootElement(); 95 // 拿到根节点的名称 96 System.out.println("根节点:" + rootElt.getName()); 97 98 // 获取根节点下的子节点head 99 Iterator iter = rootElt.elementIterator("head"); 100 // 遍历head节点 101 while (iter.hasNext()) { 102 103 Element recordEle = (Element) iter.next(); 104 // 拿到head节点下的子节点title值 105 String title = recordEle.elementTextTrim("title"); 106 System.out.println("title:" + title); 107 map.put("title", title); 108 // 获取子节点head下的子节点script 109 Iterator iters = recordEle.elementIterator("script"); 110 // 遍历Header节点下的script节点 111 while (iters.hasNext()) { 112 Element itemEle = (Element) iters.next(); 113 // 拿到head下的子节点script下的字节点username的值 114 String username = itemEle.elementTextTrim("username"); 115 String password = itemEle.elementTextTrim("password"); 116 117 System.out.println("username:" + username); 118 System.out.println("password:" + password); 119 map.put("username", username); 120 map.put("password", password); 121 } 122 } 123 124 //获取根节点下的子节点body 125 Iterator iterss = rootElt.elementIterator("body"); 126 // 遍历body节点 127 while (iterss.hasNext()) { 128 Element recordEless = (Element) iterss.next(); 129 // 拿到body节点下的子节点result值 130 String result = recordEless.elementTextTrim("result"); 131 System.out.println("result:" + result); 132 // 获取子节点body下的子节点form 133 Iterator itersElIterator = recordEless.elementIterator("form"); 134 // 遍历Header节点下的form节点 135 while (itersElIterator.hasNext()) { 136 Element itemEle = (Element) itersElIterator.next(); 137 // 拿到body下的子节点form下的字节点banlce的值 138 String banlce = itemEle.elementTextTrim("banlce"); 139 String subID = itemEle.elementTextTrim("subID"); 140 141 System.out.println("banlce:" + banlce); 142 System.out.println("subID:" + subID); 143 map.put("result", result); 144 map.put("banlce", banlce); 145 map.put("subID", subID); 146 } 147 } 148 } catch (DocumentException e) { 149 e.printStackTrace(); 150 } catch (Exception e) { 151 e.printStackTrace(); 152 } 153 return map; 154 } 155 156 public static void main(String[] args) { 157 158 // 下面是需要解析的xml字符串例子 159 String xmlString = "<html>" + "<head>" + "<title>dom4j解析一个例子</title>" 160 + "<script>" + "<username>yangrong</username>" 161 + "<password>123456</password>" + "</script>" + "</head>" 162 + "<body>" + "<result>0</result>" + "<form>" 163 + "<banlce>1000</banlce>" + "<subID>36242519880716</subID>" 164 + "</form>" + "</body>" + "</html>"; 165 166 /* 167 * Test2 test = new Test2(); test.readStringXml(xmlString); 168 */ 169 Map map = readStringXmlOut(xmlString); 170 Iterator iters = map.keySet().iterator(); 171 while (iters.hasNext()) { 172 String key = iters.next().toString(); // 拿到键 173 String val = map.get(key).toString(); // 拿到值 174 System.out.println(key + "=" + val); 175 } 176 } 177 178 }
例二:
1 /** 2 * 解析包含有DB连接信息的XML文件 3 * 格式必须符合如下规范: 4 * 1. 最多三级,每级的node名称自定义; 5 * 2. 二级节点支持节点属性,属性将被视作子节点; 6 * 3. CDATA必须包含在节点中,不能单独出现。 7 * 8 * 示例1——三级显示: 9 * <db-connections> 10 * <connection> 11 * <name>DBTest</name> 12 * <jndi></jndi> 13 * <url> 14 * <![CDATA[jdbc:mysql://localhost:3306/db_test?useUnicode=true&characterEncoding=UTF8]]> 15 * </url> 16 * <driver>org.gjt.mm.mysql.Driver</driver> 17 * <user>test</user> 18 * <password>test2012</password> 19 * <max-active>10</max-active> 20 * <max-idle>10</max-idle> 21 * <min-idle>2</min-idle> 22 * <max-wait>10</max-wait> 23 * <validation-query>SELECT 1+1</validation-query> 24 * </connection> 25 * </db-connections> 26 * 27 * 示例2——节点属性: 28 * <bookstore> 29 * <book category="cooking"> 30 * <title lang="en">Everyday Italian</title> 31 * <author>Giada De Laurentiis</author> 32 * <year>2005</year> 33 * <price>30.00</price> 34 * </book> 35 * 36 * <book category="children" title="Harry Potter" author="J K. Rowling" year="2005" price="$29.9"/> 37 * </bookstore> 38 * 39 * @param configFile 40 * @return 41 * @throws Exception 42 */ 43 public static List<Map<String, String>> parseDBXML(String configFile) throws Exception { 44 List<Map<String, String>> dbConnections = new ArrayList<Map<String, String>>(); 45 InputStream is = Parser.class.getResourceAsStream(configFile); 46 SAXReader saxReader = new SAXReader(); 47 Document document = saxReader.read(is); 48 Element connections = document.getRootElement(); 49 50 Iterator<Element> rootIter = connections.elementIterator(); 51 while (rootIter.hasNext()) { 52 Element connection = rootIter.next(); 53 Iterator<Element> childIter = connection.elementIterator(); 54 Map<String, String> connectionInfo = new HashMap<String, String>(); 55 List<Attribute> attributes = connection.attributes(); 56 for (int i = 0; i < attributes.size(); ++i) { // 添加节点属性 57 connectionInfo.put(attributes.get(i).getName(), attributes.get(i).getValue()); 58 } 59 while (childIter.hasNext()) { // 添加子节点 60 Element attr = childIter.next(); 61 connectionInfo.put(attr.getName().trim(), attr.getText().trim()); 62 } 63 dbConnections.add(connectionInfo); 64 } 65 66 return dbConnections; 67 }