Dom4J 中处理xml包含html标签节点的小技巧(android)
当我们需要解析一个下面的xml节点时
<title>比赛</title> <declaration> <p> 专家描述 <br/> 两队历史交战3场,鹿特丹胜1场平2场,在联赛排名第3的位置已经获得了31积分。在主场优势下,本场比赛鹿特丹队取胜难度不大。 </p> <p> 周五017威廉二世VS特温特青年队 <br/> 联赛排位第2名,17场比赛获胜9场平4场,本场看好威廉二世 </p> </declaration>
上面这个段xml代码,其实只有两个节点:title和declaration,declaration的内容为一段带html标签的字符串。 解析title标签如下:
Element titleElement = (Element) doc.selectSingleNode("title"); if (titleElement != null) { String title = titleElement.getTextTrim(); }
但是如果使用同样的方法来解析declaration标签是不会成功的,因为declaration里面是合格的html代码,而html的标签会导致dom4j失败,我的目标是将declaration标签下所有的内容当作一个字符串(包含html标签)。
解决办法:使用Node的对象
Node declarationNode = doc.selectSingleNode("declaration"); if (declarationNode != null) { String asXML = declarationNode.asXML(); asXML.replaceAll("<declaration>", ""); asXML.replaceAll("</declaration>", ""); String declaration = asXML; }
当然,所有以上都是基于Android中TextView能使用setText(Html.from(html))方法