SAX解析XML

在使用 DOM 解析 XML 文档时,需要读取整个 XML 文档,在内存中构架代表整个 DOM 树的Doucment对象,从而再对XML文档进行操作。此种情况下,如果 XML 文档特别大,就会消耗计算机的大量内存,并且容易导致内存溢出。
SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。
 
SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器:
  •解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。
  •解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内  容作为方法的参数传递给事件处理器。
  •事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。
 
book.xml
<?xml version="1.0" encoding="UTF-8"?>

<书架>
	<书>
		<书名>java web就业</书名>
		<作者>张孝祥</作者>
		<售价>40</售价>	
	</书>
	<书>
		<书名>C++教程</书名>
		<作者>自己</作者>
		<售价>50</售价>	
	</书>

</书架>

  

package com.xmlsax;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

//自定义事件处理器, 封装xml中的配置bean到list中
class BeanListHandler extends DefaultHandler{

	private List<Book> books = new ArrayList<Book>();
	private Book book = null;
	private String currentTag = null;
	
	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes attributes) throws SAXException {
		currentTag = qName;
		if ("书".equals(currentTag)) {
			book = new Book();
		}
	}
	
	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		//System.out.println(currentTag);
		if ("书名".equals(currentTag)) {
			String name = new String(ch, start, length);
			book.setName(name);
		}
		if ("作者".equals(currentTag)) {
			String author = new String(ch, start, length);
			book.setAuthor(author);
		}
		if ("售价".equals(currentTag)) {
			String price = new String(ch, start, length);
			book.setPrice(Double.parseDouble(price));
		}
	}
	
	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		
		if ("书".equals(qName)) {
			books.add(book);
			book = null;
		}
		currentTag = null;   //必须置空,否则我们会得到标签之间的空值
	}
	public List<Book> getBooks() {
		return books;
	}
}
public class SaxTest {
	public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
		
		//1:得到sax解析器工厂
		SAXParserFactory factory = SAXParserFactory.newInstance();
		//2:获得sax解析器
		SAXParser parser = factory.newSAXParser();
		//3:获得XMLReader读取器
		XMLReader reader = parser.getXMLReader();
		
		//4: 配置事件处理器
		BeanListHandler beanListHandler = new BeanListHandler();
		reader.setContentHandler(beanListHandler);
		//5:读取XML文件
		reader.parse("src/book.xml");
		
		List<Book> list = beanListHandler.getBooks();
		for (Book b : list) {
			System.out.println(b.getName() + ": " + b.getAuthor() + " : " + b.getPrice());
		}
	} 
}

  

 

posted @ 2013-12-28 09:38  E_star  阅读(254)  评论(0编辑  收藏  举报