Android学习笔记（八）XML文档的解析

一、废话

　　最近几天四川一直下雨，冷!今天到成都的时候，下午3点多的天和晚上天差不多，黑呼呼的... ...难道传说的2012来了?哈哈哈... ...

二、正文　　

　　在上一篇笔记中提到过说在Android系统中，存储数据的方式除了SQLite外，还有很多其他的方式，比较常用的就是XML方式。在Android中，比较常用的XML解析方式有SAX方式和DOM方式。下面就来看看这两种方式吧。

1、 SAX解析

　　SAX——Simple API for XML，在org.xml.sax包中被提供使用。SAX是基于事件驱动的，有事件就一定有事件源，这个事件源就是SAX解析XML时的一个XMLReader对象。当XMLReader对象读取到XML文件的开始和结束标签时或者在取到一个节点内容时，都会触发在Handler（事件处理器）中注册的相应事件。

　　在XMLReader中可以通过setContentHandler(ContentHandler handler)方法来调用我们自己的Handler，而这个Handler就是我们解析XML文件的核心。我们可以通过继承SDK中的DefaultHandler类来实现一个我们自己的Handler。针对我们今天的主题，主要需要实现以下几个方法。

public void startDocument() throws SAXException{}——读取到文档时触发的事件，通常可以通过这个事件来处理一些IO错误之类的事情。
public void startElement(String uri, String localName, String qName,Attributes attributes) throws SAXException{}——读取到XML文档内容中的标签时触发，如<work></work>中的<work>标签。
- uri XML文档中NameSpace的URI，如果不清楚XML文档中Namespace的可以去网上看看。
- localName 无前缀的标签名，如<works><work></work></works>标签，返回的可以是work字符串。
- qName 有前缀具有完整路径的标签名，如<works><work></work></works>中返回的是/works/work字符串。
- attributes 标签中的属性名，如<work id=”111”></work>这里面的id就是属性，而”111”就是属性值。
public void endElement(String uri, String localName, String qName)throws SAXException{}——读取到XML文档内容中的结束标签时触发。
public void endDocument() throws SAXException{}——读取到XML文档结尾时触发该事件。
public void characters(char[] ch, int start, int length)throws SAXException{}——读取到XML文档某个标签下的内容时，就会调用这个方法返回该内容。
- ch 内容的字符值。
- start 读取的开始位置。
- length 读取的内容长度。

　　a) 现在来理下要解析XML文档的整个思路

- 新建一个SAXParserFactory对象，通过该对象的newSAXParser()方法来获得一个SAXParser对象。
- 通过SAXParser对象的getXMLReader()方法来获得一个XMLReader对象。
- 利用XMLReader对象的setConentHandler()方法来注册一个我们自己的Handler对象。
- 利用XMLReader对象的parse()方法来开始处理我们的XML文档。
- 实现自己的Handler类。

　　b) 普通方式下的解析

 1 package LiB.XMLDemo;
 2 
 3 import org.xml.sax.Attributes;
 4 import org.xml.sax.SAXException;
 5 import org.xml.sax.helpers.DefaultHandler;
 6 
 7 public class SAXHandler extends DefaultHandler {
 8 
 9     String tagName;
10     //当有值存在时，就调用该方法解析取值（如果是空值，也会调用这个方法）
11     @Override
12     public void characters(char[] ch, int start, int length)
13             throws SAXException {
14         String value= new String(ch, start,length);
15         if(tagName.equals("name"))
16         {
17             System.out.println("name="+ value);
18         }
19          if(tagName.equals("age"))
20         {
21             System.out.println("age="+value);
22         }
23     }
24 　　
25     @Override
26     public void endDocument() throws SAXException {
27 
28             System.out.println("---end----");
29     }
30 
31     @Override
32     public void endElement(String uri, String localName, String qName)
33             throws SAXException {
34         if(localName.equals("work"))
35         {
36             System.out.println("-----end----work");
37         }
38     }
39 
40     @Override
41     public void startDocument() throws SAXException {
42 
43             System.out.println("---begin----");
44     }
45 
46     @Override
47     public void startElement(String uri, String localName, String qName,
48             Attributes attributes) throws SAXException {
49         tagName = localName;
50         if(localName.equals("work"))
51         {
52             for(int i=0;i< attributes.getLength();i++)
53             {
54                 System.out.println(attributes.getLocalName(i)+"="+attributes.getValue(i));
55             }
56         }
57     }
58 
59 }

　　上面这个方法中存在一个问题：在读取出来的数据中，没区分开始标签和结束标签，所以出现了空值的状况。这个问题我一直都很奇怪，因为在不久前我处理的时候是不存在这个问题的，可是现在出现了。

　　c) 改进后的解析

　　解决的方法在网上也挺多的，而且大家都比较相似，就是在startElement和endElement方法中设置相应的标志位，然后在characters方法中通过标志位来决定是否需要读取它的内容。

　　修改后的方法有兴趣的朋友可以把源码下载下来看看。

2、 DOM解析

　　DOM方式解析XML文件呢，就需要将整个XML文档装入我们的手机内存中，如果文档过大，那么将非常的耗费内存，但是这样的好处是解析速度很快，同时DOM解析方式可以只解析你需要的那个部分，灵活性非常大。

　　DOM解析的原理呢，其实就是把动过DOM API访问XML文档的树形结构，并获取相应的数据。在java中通过DOM解析XML文件，一般会涉及到以下几个类。

DocumentBuilderFactory——创建DocumentBuilder对象的工厂类。
DocumentBuilder——通过这个方法可以创建一个能够获取Document实例的API。
Document——加载XML文档的入口，这是解析文档的源所在。
Element——元素，在DOM中，所有的节点都可以称作Element。
NodeList——节点的集合。

　　来看看通过DOM方式解析XML文档的步骤吧：

通过javax.xml.parsers包中的DocumentBuilderFactory类的newInstance()方法新建一个DocumentBuilderFactory对象。
通过DocumentBuilderFactory对象的newDocumentBuilder ()方法创建一个DoucumentBuilder对象。
通过DoucumentBuilder的parse()方法读取外部流来创建一个Document对象。
通过Document对象来获得文档中的所有节点的根节点。
通过根节点来解析所需要的文件内容。

 1 package LiB.XMLDemo;
 2 
 3 
 4 import javax.xml.parsers.DocumentBuilder;
 5 import javax.xml.parsers.DocumentBuilderFactory;
 6 
 7 import org.w3c.dom.Document;
 8 import org.w3c.dom.Element;
 9 import org.w3c.dom.Node;
10 import org.w3c.dom.NodeList;
11 import org.xml.sax.InputSource;
12 
13 public class DomHandler {
14     public static void GetStringFromDom(InputSource inputSource) {
15         try {
16             DocumentBuilderFactory factory = DocumentBuilderFactory
17                     .newInstance();
18             DocumentBuilder builder = factory.newDocumentBuilder();
19             Document document = builder.parse(inputSource);
20             //获取根节点
21             Element rootElement = document.getDocumentElement();
22             //获取第一级子节点
23             NodeList nodeList = rootElement.getElementsByTagName("work");
24             for(int i=0 ; i<nodeList.getLength();i++)
25             {
26             //String work = rootElement.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();
27 
28                 Element workElement = ((Element)nodeList.item(i));
29                 //获取节点中的属性值
30 //String attr= workElement.getAttribute("XXX");
31 //通过节点的标签名字来获取值
32                 String name = workElement.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();
33                 String age = workElement.getElementsByTagName("age").item(0).getFirstChild().getNodeValue();
34                 System.out.println("name="+name);
35                 System.out.println("age="+age);
36             }
37 
38         } catch (Exception e) {
39         }
40     }
41 }

　　其实是用DOM方式来解析XML文件，有一些.NET和java开发经验的同学看到上面的代码都应该非常亲切，因为这和在.NET和java中相似。

3、二者区别

　　SAX——流式解析，通过事件模型解析XML文件，对内存消耗比较小。但是只能顺序解析，也就是说如果你需要的数据在文件的末尾，那么你将需要把整个XML文件全部解析才能得到你想要的数据。

　　Dom解析——符合W3C标准的一种解析方式。解析速度非常快。在几乎所有的语言中，都能使用，可以解析你所需要的数据（不管这个数据在文件中间还是文件末尾）。但是这个需要全部加载进系统内存中才能进行解析。

三、总结

　　这这个笔记中介绍了两种解析XML文档的方法。从下篇笔记开始，我将介绍如何与蓝牙、WIFI、网络传输相关的一些知识。

【源码下载】

posted @ 2012-01-10 18:24 Libo@Deng 阅读(3248) 评论(5) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· 单线程的Redis速度为什么快？
· 展开说说关于C#中ORM框架的用法！
· Pantheons：用 TypeScript 打造主流大模型对话的一站式集成库

公告

昵称： Libo@Deng
园龄： 15年8个月
粉丝： 130
关注： 28

+加关注

2012年1月

日

一

二

三

四

五

六

Libo@Deng

Android学习笔记（八）XML文档的解析

一、废话

二、正文

1、 SAX解析

a) 现在来理下要解析XML文档的整个思路

b) 普通方式下的解析

c) 改进后的解析

2、 DOM解析

3、二者区别

三、总结

公告

搜索

最新随笔

我的标签

积分与排名

随笔分类 (29)

随笔档案 (30)

阅读排行榜

推荐排行榜

最新评论

Libo@Deng

Android学习笔记（八）XML文档的解析

一、废话

二、正文

1、 SAX解析

a) 现在来理下要解析XML文档的整个思路

b) 普通方式下的解析

c) 改进后的解析

2、 DOM解析

3、 二者区别

三、总结

公告

搜索

最新随笔

我的标签

积分与排名

随笔分类 (29)

随笔档案 (30)

阅读排行榜

推荐排行榜

最新评论

二、正文　　

　　a) 现在来理下要解析XML文档的整个思路

　　b) 普通方式下的解析

　　c) 改进后的解析

3、二者区别