SAX PULL DOCUMENT解析XML总结
一、SAX解析
1、继承DefaultHandler类,重写startDocument、startElement、character、endElement、endDocument方法,startDocument在读取<?xml version="1.0" encoding="UTF-8"?>时调用,可写一些实例化列表等;startElement在读取每个标签时调用,通过判断历史标签需要是否为需要获取的值的头;characters用来读取标签中的值;endElement读取标签的结束,用来保存characters获取的值;endDocument一般不做处理。
2、调用,用SAXParser或者XMLReader来解析
SAXParser解析
SAXHandlerParseService saxForHandler = new SAXHandlerParseService(); SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser saxParse = spf.newSAXParser(); saxParse.parse(input, saxForHandler); List<Map<String, Object>> userList = saxForHandler.getUser();
XMLReader解析
SAXHandlerParseService saxForHandler = new SAXHandlerParseService(); SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser saxParse = spf.newSAXParser(); // 为xmlReader设置内容处理器 XMLReader reader = saxParse.getXMLReader(); reader.setContentHandler(saxForHandler); // 开始赋值 reader.parse(new InputSource(new StringReader(xml))); List<Map<String, Object>> userList = saxForHandler.getUser();
在解析时,一定要小心,不要忽略空白的地方,Sax解析器会把它认为是一个TextNod
二、PULL解析
与SAX类似,同样有START_DOCUMENT、START_ELEMENT、CHARACTERS、END_ELEMENT、END_DOCUMENT
1、实例化XmlPullParser解析器,设置输入编码(setInput),获得事件类型(getEventType),用SAX相同的处理进行,next()方法往下继续读取
三、DOCUMENT解析
1、实例化DocumentBuilderFactory,代码如下:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document document = builder.parse(input); Element root = document.getDocumentElement();
2、跟xml传入的数据结构进行处理
3、返回需要的列表值即可
工程下载:ParseTest.rar
四、三者区别
DOM:
解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。
优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;
缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;
使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)
SAX/PULL:
事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。
优点:不用事先调入整个文档,占用资源少
缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;
使用场合:只需XML文档的少量内容,很少回头访问;一次性读取;机器内存少;
注意:SAX 解析器不创建任何对象。