SAX PULL DOCUMENT解析XML总结

一、SAX解析

1、继承DefaultHandler类,重写startDocument、startElement、character、endElement、endDocument方法,startDocument在读取<?xml version="1.0" encoding="UTF-8"?>时调用,可写一些实例化列表等;startElement在读取每个标签时调用,通过判断历史标签需要是否为需要获取的值的头;characters用来读取标签中的值;endElement读取标签的结束,用来保存characters获取的值;endDocument一般不做处理。

2、调用,用SAXParser或者XMLReader来解析

SAXParser解析

SAXHandlerParseService saxForHandler = new SAXHandlerParseService();
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser saxParse = spf.newSAXParser();
saxParse.parse(input, saxForHandler);
List<Map<String, Object>> userList = saxForHandler.getUser();

XMLReader解析

SAXHandlerParseService saxForHandler = new SAXHandlerParseService();
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser saxParse = spf.newSAXParser();
// 为xmlReader设置内容处理器
XMLReader reader = saxParse.getXMLReader();
reader.setContentHandler(saxForHandler);
// 开始赋值
reader.parse(new InputSource(new StringReader(xml)));
List<Map<String, Object>> userList = saxForHandler.getUser();

在解析时,一定要小心,不要忽略空白的地方,Sax解析器会把它认为是一个TextNod

二、PULL解析

与SAX类似,同样有START_DOCUMENT、START_ELEMENT、CHARACTERS、END_ELEMENT、END_DOCUMENT

1、实例化XmlPullParser解析器,设置输入编码(setInput),获得事件类型(getEventType),用SAX相同的处理进行,next()方法往下继续读取

三、DOCUMENT解析

1、实例化DocumentBuilderFactory,代码如下:

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(input);
Element root = document.getDocumentElement();

2、跟xml传入的数据结构进行处理

3、返回需要的列表值即可

工程下载:ParseTest.rar

四、三者区别

DOM:
       解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。
       优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;
       缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;
       使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)
 
SAX/PULL:
       事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。
       优点:不用事先调入整个文档,占用资源少
       缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;
       使用场合:只需XML文档的少量内容,很少回头访问;一次性读取;机器内存少;
       注意:SAX 解析器不创建任何对象。

 

posted @ 2012-08-06 20:31  ok_lanyan  阅读(877)  评论(0编辑  收藏  举报