<?xml version="1.0" encoding="UTF-8" ?>
<!--
<?xml version="1.0" encoding="UTF-8" ?>
以上内容就是xml文件的声明，
version="1.0" version表示xml的版本
encoding="utf-8"   encoding表示xml文件本身的编码
-->
<books>
    <book sn="SN321324"><!-- book表示一个图书信息 sn属性表示图书序列号-->
        <name>时间简历</name><!--name标签表示书名 -->
        <author>陈彬
            <![CDATA[>>>><<<<<陈彬]]>
        </author><!--auther表示作者-->
        <price>23</price><!--price表示价格-->
    </book>
    <book sn="SN238238">
        <name>从Java入门到放弃</name>
        <author>康师傅</author>
        <price>22</price>
    </book>
</books>

XML解析方式

SAX解析方式

SAX（simple API for XML）是一种XML解析的替代方法。相比于DOM，SAX是一种速度更快，更有效的方法。它逐行扫描文档，一边扫描一边解析。而且相比于DOM，SAX可以在解析文档的任意时刻停止解析。其优缺点分别为：
优点： 解析可以立即开始，速度快，没有内存压力
缺点： 不能对节点做修改

DOM解析方式

DOM：(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式。DOM解析器在解析XML文档时，会把文档中
的所有元素，按照其出现的层次关系，解析成一个个Node对象(节点)。其优缺点分别为:
优点:把xml文件在内存中构造树形结构，可以遍历和修改节点
缺点： 如果文件比较大，内存有压力，解析的时间会比较长

JDOM和DOM4J解析方式

JAVA操作XML文档主要有四种方式，分别是DOM、SAX、JDOM和DOM4J，DOM和SAX是官方提供的，而JDOM和DOM4J则是引用第三方库的，其中用的最多的是DOM4J方式。

运行效率和内存使用方面最优的是SAX，但是由于SAX是基于事件的方式，所以SAX无法在编写XML的过程中对已编写内容进行修改，但对于不用进行频繁修改的需求，还是应该选择使用SAX。

下面基于这四种方式来读取XML文件。

第一，以DOM的方式实现。

package xmls;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.File;
import java.io.IOException;
/**
 * Created by lenovo on 2017-6-3.
 */
public class DOMReadDemo {
  public static void main(String[] args){
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    try{
      DocumentBuilder db = dbf.newDocumentBuilder();
      Document document = db.parse("src/xmls/DOM.xml");
      NodeList booklist = document.getElementsByTagName("book");
      for(int i = 0; i < booklist.getLength(); i++){
        System.out.println("--------第" + (i+1) + "本书----------");
        Element ele = (Element) booklist.item(i);
        NodeList childNodes= ele.getChildNodes();
        for(int j = 0; j < childNodes.getLength(); j++){
          Node n = childNodes.item(j);
          if(n.getNodeName() != "#text"){
            System.out.println(n.getNodeName() + ":" + n.getTextContent());
          }
        }
        System.out.println("---------------------------------");
      }
    }catch (ParserConfigurationException e){
      e.printStackTrace();
    }catch (IOException e){
      e.printStackTrace();
    }catch (SAXException e){
      e.printStackTrace();
    }
  }
}

第二，以SAX的方式实现。

package xmls;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
/**
 * Created by lenovo on 2017-6-1.
 */
public class xmlTest2 {
  public static void main(String[] args){
    SAXParserFactory spf = SAXParserFactory.newInstance();
    try{
      SAXParser sp = spf.newSAXParser();
      SAXParserHandler handler = new SAXParserHandler();
      sp.parse("src\\xmls\\book.xml", handler);
    }catch (Exception e){
      e.printStackTrace();
    }
  }
}

package xmls;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
/**
 * Created by lenovo on 2017-6-1.
 */
public class SAXParserHandler extends DefaultHandler {
  @Override
  public void startDocument() throws SAXException {
    super.startDocument();
    System.out.println("SAX解析开始");
  }
  @Override
  public void endDocument() throws SAXException {
    super.endDocument();
    System.out.println("SAX解析结束");
  }
  @Override
  public void startElement(String s, String s1, String s2, Attributes attributes) throws SAXException {
    super.startElement(s, s1, s2, attributes);
    System.out.println(s2);
    for(int i = 0; i < attributes.getLength(); i++){
      String name = attributes.getQName(i);
      String value = attributes.getValue(name);
      System.out.println("属性值：" + name + "=" + value);
    }
  }
  @Override
  public void endElement(String s, String s1, String s2) throws SAXException {
    super.endElement(s, s1, s2);
    if(s2.equals("book")){
      System.out.println("-----------------------");
    }
  }
  @Override
  public void characters(char[] ch, int start, int length) throws SAXException {
    super.characters(ch, start, length);
    String value = new String(ch, start, length);
    if(value.trim().equals("")){
      return;
    }
    System.out.println(value);
  }
}

Java 解析xml中参数解释-localName和qName

https://blog.csdn.net/django100/article/details/12707317

订阅专栏
1. xml中的localName和QName
<?xml version="1.0" encoding="utf-8"?>
<websites
    xmlns:sina="http://www.sina.com"
    xmlns:baidu="http://www.baidu.com">
    
    <sina:website sina:blog="blog.sina.com">新浪</sina:website>
    <baidu:website baidu:blog="hi.baidu.com">百度</baidu:website>
</websites>

Namespace（空间名称，命名空间）
引入的原因是为了避免混淆。例如上面的这个XML文档，sina和baidu都有blog属性，定义了两个namespace，就像sax官网说的，用namespace是为了实现更多的扩展功能，作为基本应用，很多时候都用不到它：

sina的namespace： http://www.sina.com
baidu的namespace：http://www.baidu.com
    xmlns:sina="http://www.sina.com"
    xmlns:baidu="http://www.baidu.com">
    namespace的值可以任意，但是注意不要重复。一般默认的格式都是以url来作为namespace，比如 xmlns:android="http://schemas.android.com/apk/res/android。

Prefix（前缀）
sina:blog中 sina 就是前缀。
LocalName（本地名称）
sina:blog 中 blog就是localName。

QName（Qualified Name)
sina:blog就是QName，相当于前缀+":"+LocalName。

uri（不是url哈）
例如sina:blog的uri就是前缀sina的namespace，即"http://www.sina.com"。

2.sax解析localName与qName
sax  simple API for XML，现在有两个版本，sax和sax2。

sax不支持LocalName、QName和uri。对于属性sina:blog="blog.sina.com"，sax解析的结果是LocalName=QName="sina:blog"，uri=""，value="blog.sina.com"。
sax2支持LocalName、QName、uri。对于属性sina:blog="blog.sina.com"，sax2解析的结果是LocalName="blog"，QName="sina:blog"，uri=""，value="blog.sina.com"。

_______________________________________________________________________________________________________________________________________________________________________
测试：

TestSax.java

package com.siqi.xml;
 
import java.io.File;
import java.io.FileReader;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
 
import org.xml.sax.InputSource;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.XMLReaderFactory;
 
public class TestSax {
	public static void main(String... args) {
		
		try {
			//Sax2解析XML文档
			System.out.println("parse xml file use sax2");
			SaxParseHandler sax2Handler = new SaxParseHandler();
			XMLReader xmlReader = XMLReaderFactory.createXMLReader();
			xmlReader.setContentHandler(sax2Handler);
			xmlReader.setErrorHandler(sax2Handler);
 
			FileReader fileReader = new FileReader("./src/sample.xml");
			xmlReader.parse(new InputSource(fileReader));
			
			//sax1解析XML文档
			System.out.println("parse xml file use sax");
			SaxParseHandler saxHandler = new SaxParseHandler();
			SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
			
			File file = new File("./src/sample.xml");
	        parser.parse(file, saxHandler);
			
		} catch (Exception e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} 
	}
}

__________________________________________________________________________________________________________________________________________________________________________

SaxParseHandler.java
package com.siqi.xml; 
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
 
/**
 * 要用sax解析，需要实现一个ParseHandler
 * @author siqi
 *
 */
public class SaxParseHandler extends DefaultHandler{
 
	/**
	 * 重写了DefaultHandler中的startElement函数，每解析到
	 * 一个元素（element）的时候都会触发这个函数，并且将这个element
	 * 的属性attributes和值value当作参数传进来。除了startElement,
	 * 还有startDocument，endDOucment，endElement，要根据需要
	 * 重写这些函数。
	 */
	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes attributes) throws SAXException {
		
		//打印element的基本信息，qName
		System.out.println("Element qName    : "+qName);
		System.out.println("Element localName: "+localName);
		System.out.println("Element uri      : "+uri);
		//打印element的所有属性attributes
		for(int i=0; i<attributes.getLength(); i++) {
			System.out.println("");
			System.out.println("  attribute qName    : "+attributes.getQName(i));
			System.out.println("  attribute localName: "+attributes.getLocalName(i));
			System.out.println("  attribute value    : "+attributes.getValue(i));
			System.out.println("  attribute uri      : "+attributes.getURI(i));
		}
		System.out.println("");
		super.startElement(uri, localName, qName, attributes);
	}
	
}

sample.xml的内容最上面那个xml
执行结果：
parse xml file use sax2
Element qName    : websites
Element localName: websites
Element uri      : 
 
Element qName    : sina:website
Element localName: website
Element uri      : http://www.sina.com
 
  attribute qName    : sina:blog
  attribute localName: blog
  attribute value    : blog.sina.com
  attribute uri      : http://www.sina.com
 
Element qName    : baidu:website
Element localName: website
Element uri      : http://www.baidu.com
 
  attribute qName    : baidu:blog
  attribute localName: blog
  attribute value    : hi.baidu.com
  attribute uri      : http://www.baidu.com
 
parse xml file use sax
Element qName    : websites
Element localName: 
Element uri      : 
 
  attribute qName    : xmlns:sina
  attribute localName: xmlns:sina
  attribute value    : http://www.sina.com
  attribute uri      : 
 
  attribute qName    : xmlns:baidu
  attribute localName: xmlns:baidu
  attribute value    : http://www.baidu.com
  attribute uri      : 
 
Element qName    : sina:website
Element localName: 
Element uri      : 
 
  attribute qName    : sina:blog
  attribute localName: sina:blog
  attribute value    : blog.sina.com
  attribute uri      : 
 
Element qName    : baidu:website
Element localName: 
Element uri      : 
 
  attribute qName    : baidu:blog
  attribute localName: baidu:blog
  attribute value    : hi.baidu.com
  attribute uri      : 

对于sax2，正确的解析出了qName，LocalName和uri。sax不能识别出前缀和uri，qName=localName。

第三，以JDOM的方式实现。

package xmls;
import org.jdom2.Attribute;
import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.JDOMException;
import org.jdom2.input.JDOMParseException;
import org.jdom2.input.SAXBuilder;
import java.io.*;
import java.util.List;
/**
 * Created by lenovo on 2017-6-2.
 */
public class JDOMTest {
  public static void main(String[] args){
    SAXBuilder saxBuilder = new SAXBuilder();
    InputStream in;
    try{
      in = new FileInputStream(new File("src\\xmls\\book.xml"));
      Document document = saxBuilder.build(in);
      Element rootElement = document.getRootElement();
      List<Element> bookList = rootElement.getChildren();
      for(Element book: bookList){
        System.out.println("第" + (bookList.indexOf(book)+1) + "本书！");
        List<Attribute> attrs = book.getAttributes();
        for(Attribute attr: attrs){
          System.out.println(attr.getName() + "=" + attr.getValue());
        }
        for(Element item: book.getChildren()){
          System.out.println(item.getName() + ":" + item.getValue());
        }
        System.out.println("------------------------------------");
      }
    }catch (FileNotFoundException e){
      e.printStackTrace();
    }catch (JDOMException e){
      e.printStackTrace();
    }catch (IOException e){
      e.printStackTrace();
    }
  }
}

第四，以DOM4J的方式实现。

package xmls;
import org.dom4j.*;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.Iterator;
import java.util.List;
/**
 * Created by lenovo on 2017-6-2.
 */
public class DOM4JTest {
  public void parseXML(){
    SAXReader saxReader = new SAXReader();
    try{
      Document document = saxReader.read(new File("src\\xmls\\book.xml"));
      Element rootElement = document.getRootElement();
      Iterator it = rootElement.elementIterator();
      while (it.hasNext()){
        Element book = (Element)it.next();
        List<Attribute> attrs = book.attributes();
        for(Attribute attr: attrs){
          System.out.println("属性名：" + attr.getName() + "---- 属性值：" + attr.getValue() );
        }
        Iterator cit = book.elementIterator();
        while (cit.hasNext()){
          Element child = (Element) cit.next();
          System.out.println("子节点：" + child.getName());
        }
      }
    }catch (DocumentException e){
      e.printStackTrace();
    }
  }
  public static void main(String[] args){
    DOM4JTest dom4JTest = new DOM4JTest();
    dom4JTest.parseXML();
  }
}

以上这篇java读取XML文件的四种方法总结(必看篇)就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

posted @ 2021-12-20 16:53 kelelipeng 阅读(19401) 评论(0) 收藏举报

刷新页面返回顶部

kelelipeng

java读取XML文件的四种方法总结(必看篇)

1. https://www.jb51.net/article/115316.htm

2. JAVA对XML文件的读写 https://www.cnblogs.com/cheng18/p/12052525.html

3. Java操作XML的工具类 https://www.cnblogs.com/DreamDrive/p/5762605.html

XML解析方式

SAX解析方式

DOM解析方式

JDOM和DOM4J解析方式

公告