Android DOM解析XML方法及优化
在Android应用开发中,我们常常要在应用启动后从服务器下载一些配置文件,这些配置文件包含一些项目中可能用到的资源,这些文件很多情况下是XML文件,这时就要将XML下载到文件中保存,之后再解析XML。解析XML的方法有DOM, SAX, JDOM, DOM4J,本文中只使用了DOM,下面先介绍DOM的基础知识和解析XML的方法,然后再结合一个项目实例来实现从XML文件的下载到解析整个过程。
DOM(Document Object Model,文档对象模型)定义了访问和操作XML的标准方法。基于DOM的XML解析器会将整个XML文档转化成对象模型集合,这个集合是树结构。这样我们就可以通过DOM接口来访问任意的节点,整个DOM树的结构和XML文档的数据分层结构相似,所以对开发者来说DOM接口的使用就很方便和直观了。但是,不足之处在于,由于这个DOM树是保存在内存中的,如果XML文档中数据很多,结构很复杂,那么就会导致其对内存的要求高,遍历一次的时间长。
下面来看一个XML文档中数据的例子。
<bookstore> <book category="children"> <title lang="en">Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price> </book> </bookstore>
该文档转化成DOM树,如下
在DOM数中,XML文档中每个成分都是一个节点。
1.整个XML文档是一个文档节点;
2.每个XML标签是一个元素节点;
3.包含在XML标签中的文本是一个文档节点;
4.每个XML属性是一个属性节点;
5.注释属于注释节点。
需要注意的是:<year>2005</year> 中的year是一个元素节点,2005是元素节点year的子节点(文本节点)的值,不是year节点的值。
DOM中节点的属性
nodeName节点的名称
元素节点nodeName与标签名相同
属性节点nodeName与属性的名称
文本节点nodeName永远是#text
文档节点nodeName永远是#document
nodeValue节点的值
元素节点的nodeValue值是undefined
文本节点的nodeValue值是文本本身
属性节点的nodeValue是属性值
nodeType节点的类型
元素节点:1
属性节点:2
文本节点:3
注释节点:4
文档节点:9
DOM中的方法
getElementsByTagName()返回拥有指定名标签的所有元素。
xmlDoc=loadXMLDoc("books.xml");
x=xmlDoc.getElementsByTagName("title");
使用childNodes 或 getElementsByTagName() 属性或方法时,会返回 NodeList 。在NodeList中保存的节点不包含属性节点。
元素节点的 attributes 属性返回属性节点的列表。
xmlDoc=loadXMLDoc("books.xml");
x=xmlDoc.getElementsByTagName("book")[0].attributes;
下面结合在项目开发中的一个实例来完整的介绍DOM解析XML方法的使用。
1. 从服务器端下载XML文档并保存到本地
/** * 从服务器端下载配置文件,并保存在basesettings.xml中 * */ private void downLoadConfigXml(){ String sValue=null; sValue=PLATE_WWW+“baseconfig.xml” //得到URL,PLATE_WWW是平台的URL Log.i(TAG,"baseconfig sValue=="+sValue); final String url=sValue; //开启一个新的线程来下载XML文档 new Thread(){ public void run(){ HttpClient client=new DefaultHttpClient(); HttpGet get=new HttpGet(url); HttpResponse response; try{ response=client.execute(get); HttpEntity entity=response.getEntity(); long length=entity.getContentLength(); InputSteam is=entity.getContent(); FileOutputStream fileOutputStream=null; if(is!=null){ //开启存放XML文档的文件流 fileOutputStream=openFileOutput("baseconfig.xml", Context.MODE_WORLD_READABLE+Context.MODE_WORLD_WRITLEABLE); byte[]buf=new byte[1024]; int ch=-1; while((ch=is.read(buf))!=-1){ Log.i(TAG,"ConfigXml下载中..."); fileOutputStream.write(buf,0,ch); } } fileOutputStream.flush(); //下载完毕,关闭文件流 if(fileOutputStream!=null){ fileOutputStream.close(); } Log.i(TAG,"ConfigXml下载完成"); }catch(ClientProtocolException e){ e.printStackTrace(); //下载出现错误,通过Handler来做出UI上的提示 mHandler .obtainMessage(GlobalDef.WM_ALL_SERVER_FAIL).sendToTarget(); }catch(){ e.printStackTrace(); //下载出现错误,通过Handler来做出UI上的提示 mHandler .obtainMessage(GlobalDef.WM_ALL_SERVER_FAIL).sendToTarget(); } } }.start(); }
2.创建DOM解析器
/** * DOM解析器:包含对XML文档的加载和解析方法 */ public class MyXml{ Document mDocument;//代表整个XML文档树,其nodeName为#document Element mDocRoot;//根节点,也是一个元素节点 NodeList mNodeList;//节点链表 Node mNode;//节点 int mNodeIndex=0;//遍历树时的索引 //DOM加载XML文档:有以下三种 public boolean loadXML(byte[] sXML){ DocumentBuilderFactory docFactory=DocumentBuildFactory.newInstance(); DocumentBuild docBuilder; try{ docBuilder=docFactory.newDocumentBuilder(); InputStream is=new ByteArrayInputStream(sXML); mDocument=docBuilder.parse(is,"GB2312");//文档节点 mDocRoot=mDocument.getDoucmentElement();//返回DOM树的根结点 }catch(Exception e){ e.printStackTrace(); return false; } return true; } public boolean loadXML(byte[] sXML, String sCodec)//设置编码形式 { DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance(); DocumentBuilder docBuilder; try { String str = new String(sXML, sCodec); docBuilder = docFactory.newDocumentBuilder(); InputStream is = new ByteArrayInputStream(str.getBytes()); mDocument = docBuilder.parse(is); mDocRoot = m_Document.getDocumentElement(); } catch (Exception e) { e.printStackTrace(); return false; } return true; } public boolean loadIS(InputStream is, String sCodec) { DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance(); DocumentBuilder docBuilder; try { docBuilder = docFactory.newDocumentBuilder(); mDocument = docBuilder.parse(is); mDocRoot = m_Document.getDocumentElement();//获取根节点 } catch (Exception e) { e.printStackTrace(); return false; } catch (OutOfMemoryError e) { e.printStackTrace(); return false; } return true; } }
所要解析的XML文档内容
<items> <gifthead> <gifttype>1</gifttype> <giftname>初次相见</giftname> <giftsort>1</giftsort> </gifthead> <item> <index>100001</index> <picname>100001.bmp</picname> <bigpicname>100001.gif</bigpicname> <itemname>鲜花</itemname> </item> <NewVer>1</NewVer> </items>
我们通过DOM在XML中寻找节点时,往往效率低下,因为每寻找一个节点就需要从新遍历一次DOM树,在这里我在MyXml类中封装了方法GetNodeList,可以把要查询的节点的路径作为参数传入,这样就可以优化这个查询效率。比如<item>的子节点中的<picname>节点,那么以picname/item/items的形式传入,即可获得所有的item节点下的picname节点。
public boolean SelectNodeToList(String sExpress) { if(mDocRoot==null) return false; mNodeList = GetNodeList(sExpress); mNodeIndex = 0; if(mNodeList !=null) { return true; } else return false; } public NodeList GetNodeList(String sExpress) { if(mDocRoot==null) return null; try { String [] sNodePaths = sExpress.split("/");//用“/”来分隔String,分隔后的字段中没有“/”,得到[, , items] Element currentNode = m_DocRoot; List<String> sNodeTree = new ArrayList<String>(); for(int i = 0;i<sNodePaths.length;i++) { if(sNodePaths[i].length()!=0) { sNodeTree.add(sNodePaths[i]);//“item”加到List中 } } for(int i = 0;i<sNodeTree.size() - 1;i++) { // Log.i(i+": "); // Log.i(sNodeTree.get(i)); if(!sNodeTree.get(i).equals("")) { // Log.i("currentNode = (Element) (currentNode.getElementsByTagName(sNodeTree.get(i))).item(0);"); currentNode = (Element) (currentNode.getElementsByTagName(sNodeTree.get(i))).item(0);//获取根节点的子节点中所有名为items节点集合中的第一个节点 } } // Log.i(sNodeTree.size()-1+": "); // Log.i(sNodeTree.get(sNodeTree.size()-1)); mNodeList = currentNode.getElementsByTagName(sNodeTree.get(sNodeTree.size()-1)); if(mNodeList.getLength() == 0 && currentNode.getNodeName().equals(sNodeTree.get(sNodeTree.size()-1)) &¤tNode == mDocRoot) { mNodeList = mDocument.getChildNodes(); }//修正Android4.0系统收不到消息的bug } catch (Exception e) { Log.i(TAG, "GetNodeList m_NodeList = currentNode.getElementsByTagName(sNodeTree.get(sNodeTree.size()-1)) error."); e.printStackTrace(); return null; } if(mNodeList !=null) { return mNodeList; } else return null; } public Node GetNode(String sExpress) { if(mDocRoot==null) return null; if(sExpress.equals(".")) return m_DocRoot; try { String [] sNodePaths = sExpress.split("/"); Element currentNode = m_DocRoot; List<String> sNodeTree = new ArrayList<String>(); for(int i = 0;i<sNodePaths.length;i++) { if(sNodePaths[i].length()!=0) { sNodeTree.add(sNodePaths[i]); } } for(int i = 0;i<sNodeTree.size() - 1;i++) { // Log.i(i+": "); // Log.i(sNodeTree.get(i)); if(!sNodeTree.get(i).equals("")) { // Log.i("currentNode = (Element) (currentNode.getElementsByTagName(sNodeTree.get(i))).item(0);"); currentNode = (Element) (currentNode.getElementsByTagName(sNodeTree.get(i))).item(0); } } // Log.i(sNodeTree.size()-1+": "); // Log.i(sNodeTree.get(sNodeTree.size()-1)); mNodeList = currentNode.getElementsByTagName(sNodeTree.get(sNodeTree.size()-1)); } catch (Exception e) { e.printStackTrace(); } if(mNodeList !=null) { return mNodeList.item(0); } else return null; } public Node QueryNode(boolean bReset) { // Log.i("QueryNode "+bReset); if (bReset) { mNodeIndex = 0; return mNodeList.item(mNodeIndex); } try { // Log.i("QueryNode "+bReset); mNode = null; mNode = mNodeList.item(mNodeIndex); mNodeIndex++; // Log.i("mNodeIndex"+mNodeIndex+"="+mNode); } catch(Exception e) { Log.w(TAG, "QueryNode mNode = mNodeList.item(mNodeIndex) error."); } return m_Node; } //获取m_Node节点下指定的节点的值 public String GetValueByName(String sName) { //Log.i(TAG, "GetValueByName: sName = "+sName); Element element = (Element)m_Node; String sValue = null; if(sName.equals(".")) { try{ sValue = mNode.getFirstChild().getNodeValue(); }catch(Exception e){ Log.i(TAG, "GetValueByName("+ sName +") --> sValue = mNode.getFirstChild().getNodeValue() error."); } } else { try { NodeList nodelist = element.getElementsByTagName(sName); if(nodelist != null) { sValue = nodelist.item(0).getFirstChild().getNodeValue(); } }catch(Exception e){ // Log.i(TAG, "GetValueByName ("+ sName +") --> sValue = nodelist.item(0).getFirstChild().getNodeValue() error."); } } if(sValue==null) { // Log.w(TAG, sName+"节点值sValue==null, Return"); } return sValue; }