Android XML数据解析
XML:可扩展标记语言。一般用于数据存储,SharedPreference就是使用xml文件保存信息的,SQLite底层也是xml文件,在网络方面通常作为信息的载体,把数据包装成xml来传递。
XML解析方式:SAX、DOM、PULL。
SAX解析XML数据
SAX解析速度快,占用内存少,非常适合Android等移动设备。SAX解析采用的是事件驱动,不需要解析整个文档,而是在解析过程中,判断读到的字符是否符合xml语法的某个部分(文档开始、结束,标签开始、结束),符合则出触发事件(回调方法),这些方法定义在ContentHandler接口中,为便于使用Android提供了一个DefaultHandler帮助类,只要继承这个类,重写相应的方法即可。
重写的方法:
startDocument():文档开始时触发,做初始化工作。
endDocument():文档结束时触发,完成善后工作。
startElement():元素开始时触发。
endElement():元素结束时触发。
characters(ch,start,length):处理在xml中读到的内容,ch存放文件内容、start和length读到内容在数组中的起始位置和长度。使用new String(ch,start,length)可以获取内容。
核心代码
public class SaxHelper extends DefaultHandler { private Person person; private ArrayList<Person> persons; //当前解析的元素标签 private String tagName = null; /** * 当读取到文档开始标志是触发,通常在这里完成一些初始化操作 * @throws SAXException */ @Override public void startDocument() throws SAXException { this.persons = new ArrayList<Person>(); Log.i("SAX", "读取到文档头,开始解析xml"); } /** * 读到一个开始标签时调用,第二个参数为标签名,最后一个参数为属性数组 * @param uri * @param localName * @param qName * @param attributes * @throws SAXException */ @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { if (localName.equals("person")){ person = new Person(); person.setId(Integer.parseInt(attributes.getValue("id"))); Log.i("SAX", "开始处理person元素~"); } this.tagName = localName; } /** * 读到到内容,第一个参数为字符串内容,后面依次为起始位置与长度 * @param ch * @param start * @param length * @throws SAXException */ @Override public void characters(char[] ch, int start, int length) throws SAXException { //判断当前标签是否有效 if (this.tagName != null){ String data = new String(ch, start, length); //读取标签中的内容 if (this.tagName.equals("name")){ this.person.setName(data); Log.i("SAX", "处理name元素内容"); }else if (this.tagName.equals("age")){ this.person.setAge(Integer.parseInt(data)); Log.i("SAX", "处理age元素内容"); } } } /** * 处理元素结束时触发,这里将对象添加到结合中 * @param uri * @param localName * @param qName * @throws SAXException */ @Override public void endElement(String uri, String localName, String qName) throws SAXException { if (localName.equals("person")){ this.persons.add(person); person = null; Log.i("SAX", "处理person元素结束~"); } this.tagName = null; } /** * 读取到文档结尾时触发, * @throws SAXException */ @Override public void endDocument() throws SAXException { super.endDocument(); Log.i("SAX", "读取到文档尾,xml解析结束"); } //获取persons集合 public ArrayList<Person> getPersons(){ return persons; } }
在MainActivity.java中写上这样一个方法,然后要解析XML的时候调用下
private ArrayList<Person> readxmlForSAX() throws Exception { //获取文件资源建立输入流对象 InputStream is = getAssets().open("person1.xml"); //①创建XML解析处理器 SaxHelper ss = new SaxHelper(); //②得到SAX解析工厂 SAXParserFactory factory = SAXParserFactory.newInstance(); //③创建SAX解析器 SAXParser parser = factory.newSAXParser(); //④将xml解析处理器分配给解析器,对文档进行解析,将事件发送给处理器 parser.parse(is, ss); is.close(); return ss.getPersons(); }
DOM解析XML数据
DOM解析xml文件时,会将文件中所有内容以文档树的形式存放到内存中,然后使用DOM API遍历、检索数据。DOM解析比较直观,编码较为简单,但是内存消耗大。
DOM中的api:
DocumentBuilderFactory()(解析工厂类):创建:DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder(解析器类):通过解析工厂来获得:DocumentBuilder dbBuilder = dbFactory.newDocumentBuilder();
Document(文档树模型):将要解析的xml文件读入DOM解析器Document doc = dbBuilder.parse(context.getAssets().open("person2.xml"));
NodeList(结点列表类):含有方法:item(index)、getLength()
Node()(结点类):DOM中最基本的对象,抽象结点,一般使用它的子对象,Element、Attr、Text等
Element()(元素类):方法:getAttribute()、getTagName()
Attr()(属性类):某个元素的属性。
核心代码
public class DomHelper { public static ArrayList<Person> queryXML(Context mContent){ ArrayList<Person> persons = new ArrayList<Person>(); try { //①获得DOM解析器的工厂示例: DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance(); //②从Dom工厂中获得dom解析器 DocumentBuilder builder = dbFactory.newDocumentBuilder(); //③把要解析的xml文件读入Dom解析器 Document document = builder.parse(mContent.getAssets().open("person2.xml")); System.out.println("处理该文档的DomImplemention对象=" + document.getImplementation()); //④得到文档中名称为person的元素的结点列表 NodeList nodeList = document.getElementsByTagName("person"); //⑤遍历该集合,显示集合中的元素以及子元素的名字 for (int i = 0; i < nodeList.getLength(); i ++){ //先从Person元素开始解析 Element personElement = (Element)nodeList.item(i); Person person = new Person(); person.setId(Integer.valueOf(personElement.getAttribute("id"))); //获取person下的name和age的Note集合 NodeList childList = personElement.getChildNodes(); for (int j = 0; j < childList.getLength(); j ++){ Node childNode = childList.item(j); //判断子note类型是否为元素Note if (childNode.getNodeType() == Node.ELEMENT_NODE){ Element childElement = (Element)childNode; if ("name".equals(childElement.getNodeName())){ person.setName(childElement.getFirstChild().getNodeValue()); }else if("age".equals(childElement.getNodeName())){ person.setAge(Integer.valueOf(childElement.getFirstChild().getNodeValue())); } } } persons.add(person); } } catch (Exception e) { e.printStackTrace(); } return persons; }
PULL解析XML数据
Android中内置了PULL解析器,PULL解析同样采用事件驱动,编码简单,只需处理开始和结束事件,通常使用switch语句,根据事件的类型,匹配不同的处理方法。
事件类型:START_DOCUMENT、START_TAG、TEXT、END_TAG、END_DOCUMENT。
PULL解析返回的是数字,需要我们自己获取产生的事件,然后做相应的操作。
PULL解析xml文件流程:
public static ArrayList<Person> getPersons(InputStream xml) throws Exception{
ArrayList<Person> persons = null;
Person person = null;
// 1、创建一个xml解析的工厂 XmlPullParserFactory factory = XmlPullParserFactory.newInstance(); //2、获得xml解析类的引用 XmlPullParser parser = factory.newPullParser(); parser.setInput(xml, "UTF-8"); //3、获得事件的类型 int eventType = parser.getEventType();
//4、用switch对不同的事件进行不同的处理 while (eventType != XmlPullParser.END_DOCUMENT){ switch (eventType){ case XmlPullParser.START_DOCUMENT:{ persons = new ArrayList<Person>(); break; } case XmlPullParser.START_TAG:{ if ("person".equals(parser.getName())){ person = new Person(); // 取出属性值 int id = Integer.parseInt(parser.getAttributeValue(0)); person.setId(id); }else if("name".equals(parser.getName())){ // 获取该节点的内容 String name = parser.nextText(); person.setName(name); }else if("age".equals(parser.getName())){ int age = Integer.parseInt(parser.nextText()); person.setAge(age); } break; } case XmlPullParser.END_TAG:{ if ("person".equals(parser.getName())){ persons.add(person); person = null; } break; } } eventType = parser.next(); } return persons; }
PULL生成xml文件流程
public static void save(List<Person> persons, OutputStream outputStream) throws Exception{
//创建XmlSerializer实例 XmlSerializer serializer = Xml.newSerializer();
//为XmlSerializer设置输入流和编码格式 serializer.setOutput(outputStream, "UTF-8");
//设置xml的编码格式 serializer.startDocument("UTF-8", true);
//设置根元素 serializer.startTag(null, "persons");
//遍历元素依次写入标签和属性 for (Person person: persons) { serializer.startTag(null, "person"); serializer.attribute(null, "id", person.getId() + ""); serializer.startTag(null, "name"); serializer.text(person.getName()); serializer.endTag(null, "name"); serializer.startTag(null, "age"); serializer.text(person.getAge() + ""); serializer.endTag(null, "age");
//设置完结元素标签 serializer.endTag(null, "person"); } serializer.endTag(null, "persons");
//结束文档 serializer.endDocument();
//flush()刷新,将数据写入文件,关闭输出流 outputStream.flush(); outputStream.close(); }
参考文献:http://www.jianshu.com/p/2fe796ca638c