java读取XML文件的四种方法总结(必看篇)

1.   https://www.jb51.net/article/115316.htm

2. JAVA对XML文件的读写  https://www.cnblogs.com/cheng18/p/12052525.html

3. Java操作XML的工具类  https://www.cnblogs.com/DreamDrive/p/5762605.html 

4. Java用SAX解析XML   https://my.oschina.net/ydsakyclguozi/blog/493509

 

<?xml version="1.0" encoding="UTF-8" ?>
<!--
<?xml version="1.0" encoding="UTF-8" ?>
以上内容就是xml文件的声明,
version="1.0" version表示xml的版本
encoding="utf-8"   encoding表示xml文件本身的编码
-->
<books>
    <book sn="SN321324"><!-- book表示一个图书信息 sn属性表示图书序列号-->
        <name>时间简历</name><!--name标签表示书名 -->
        <author>陈彬
            <![CDATA[>>>><<<<<陈彬]]>
        </author><!--auther表示作者-->
        <price>23</price><!--price表示价格-->
    </book>
    <book sn="SN238238">
        <name>从Java入门到放弃</name>
        <author>康师傅</author>
        <price>22</price>
    </book>
</books>

 

 

XML解析方式

SAX解析方式

SAX(simple API for XML)是一种XML解析的替代方法。相比于DOM,SAX是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。而且相比于DOM,SAX可以在解析文档的任意时刻停止解析。 其优缺点分别为:
优点: 解析可以立即开始,速度快,没有内存压力
缺点: 不能对节点做修改

DOM解析方式

DOM:(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式。DOM解析器在解析XML文档时,会把文档中
的所有元素,按照其出现的层次关系,解析成一个个Node对象(节点)。其优缺点分别为:
优点:把xml文件在内存中构造树形结构,可以遍历和修改节点
缺点: 如果文件比较大,内存有压力,解析的时间会比较长

JDOM和DOM4J解析方式

JAVA操作XML文档主要有四种方式,分别是DOM、SAX、JDOM和DOM4J,DOM和SAX是官方提供的,而JDOM和DOM4J则是引用第三方库的,其中用的最多的是DOM4J方式。

运行效率和内存使用方面最优的是SAX,但是由于SAX是基于事件的方式,所以SAX无法在编写XML的过程中对已编写内容进行修改,但对于不用进行频繁修改的需求,还是应该选择使用SAX。

 

下面基于这四种方式来读取XML文件。

第一,以DOM的方式实现。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
package xmls;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.File;
import java.io.IOException;
/**
 * Created by lenovo on 2017-6-3.
 */
public class DOMReadDemo {
  public static void main(String[] args){
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    try{
      DocumentBuilder db = dbf.newDocumentBuilder();
      Document document = db.parse("src/xmls/DOM.xml");
      NodeList booklist = document.getElementsByTagName("book");
      for(int i = 0; i < booklist.getLength(); i++){
        System.out.println("--------第" + (i+1) + "本书----------");
        Element ele = (Element) booklist.item(i);
        NodeList childNodes= ele.getChildNodes();
        for(int j = 0; j < childNodes.getLength(); j++){
          Node n = childNodes.item(j);
          if(n.getNodeName() != "#text"){
            System.out.println(n.getNodeName() + ":" + n.getTextContent());
          }
        }
        System.out.println("---------------------------------");
      }
    }catch (ParserConfigurationException e){
      e.printStackTrace();
    }catch (IOException e){
      e.printStackTrace();
    }catch (SAXException e){
      e.printStackTrace();
    }
  }
}

第二,以SAX的方式实现。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
package xmls;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
/**
 * Created by lenovo on 2017-6-1.
 */
public class xmlTest2 {
  public static void main(String[] args){
    SAXParserFactory spf = SAXParserFactory.newInstance();
    try{
      SAXParser sp = spf.newSAXParser();
      SAXParserHandler handler = new SAXParserHandler();
      sp.parse("src\\xmls\\book.xml", handler);
    }catch (Exception e){
      e.printStackTrace();
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
package xmls;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
/**
 * Created by lenovo on 2017-6-1.
 */
public class SAXParserHandler extends DefaultHandler {
  @Override
  public void startDocument() throws SAXException {
    super.startDocument();
    System.out.println("SAX解析开始");
  }
  @Override
  public void endDocument() throws SAXException {
    super.endDocument();
    System.out.println("SAX解析结束");
  }
  @Override
  public void startElement(String s, String s1, String s2, Attributes attributes) throws SAXException {
    super.startElement(s, s1, s2, attributes);
    System.out.println(s2);
    for(int i = 0; i < attributes.getLength(); i++){
      String name = attributes.getQName(i);
      String value = attributes.getValue(name);
      System.out.println("属性值:" + name + "=" + value);
    }
  }
  @Override
  public void endElement(String s, String s1, String s2) throws SAXException {
    super.endElement(s, s1, s2);
    if(s2.equals("book")){
      System.out.println("-----------------------");
    }
  }
  @Override
  public void characters(char[] ch, int start, int length) throws SAXException {
    super.characters(ch, start, length);
    String value = new String(ch, start, length);
    if(value.trim().equals("")){
      return;
    }
    System.out.println(value);
  }
}

 

Java 解析xml中参数解释-localName和qName

https://blog.csdn.net/django100/article/details/12707317

订阅专栏 1. xml中的localName和QName <?xml version="1.0" encoding="utf-8"?> <websites xmlns:sina="http://www.sina.com" xmlns:baidu="http://www.baidu.com"> <sina:website sina:blog="blog.sina.com">新浪</sina:website> <baidu:website baidu:blog="hi.baidu.com">百度</baidu:website> </websites> Namespace(空间名称,命名空间) 引入的原因是为了避免混淆。例如上面的这个XML文档,sina和baidu都有blog属性,定义了两个namespace,就像sax官网说的,用namespace是为了实现更多的扩展功能,作为基本应用,很多时候都用不到它: sina的namespace: http://www.sina.com baidu的namespace:http://www.baidu.com xmlns:sina="http://www.sina.com" xmlns:baidu="http://www.baidu.com"> namespace的值可以任意,但是注意不要重复。一般默认的格式都是以url来作为namespace,比如 xmlns:android="http://schemas.android.com/apk/res/android。 Prefix(前缀) sina:blog中 sina 就是前缀。 LocalName(本地名称) sina:blog 中 blog就是localName。 QName(Qualified Name) sina:blog就是QName,相当于前缀+":"+LocalName。 uri(不是url哈) 例如sina:blog的uri就是前缀sina的namespace,即"http://www.sina.com"。 2.sax解析localName与qName sax simple API for XML,现在有两个版本,sax和sax2。 sax不支持LocalName、QName和uri。对于属性sina:blog="blog.sina.com",sax解析的结果是LocalName=QName="sina:blog",uri="",value="blog.sina.com"。 sax2支持LocalName、QName、uri。对于属性sina:blog="blog.sina.com",sax2解析的结果是LocalName="blog",QName="sina:blog",uri="",value="blog.sina.com"。
_______________________________________________________________________________________________________________________________________________________________________ 测试: TestSax.java package com.siqi.xml; import java.io.File; import java.io.FileReader; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.InputSource; import org.xml.sax.XMLReader; import org.xml.sax.helpers.XMLReaderFactory; public class TestSax { public static void main(String... args) { try { //Sax2解析XML文档 System.out.println("parse xml file use sax2"); SaxParseHandler sax2Handler = new SaxParseHandler(); XMLReader xmlReader = XMLReaderFactory.createXMLReader(); xmlReader.setContentHandler(sax2Handler); xmlReader.setErrorHandler(sax2Handler); FileReader fileReader = new FileReader("./src/sample.xml"); xmlReader.parse(new InputSource(fileReader)); //sax1解析XML文档 System.out.println("parse xml file use sax"); SaxParseHandler saxHandler = new SaxParseHandler(); SAXParser parser = SAXParserFactory.newInstance().newSAXParser(); File file = new File("./src/sample.xml"); parser.parse(file, saxHandler); } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); } } }

__________________________________________________________________________________________________________________________________________________________________________
SaxParseHandler.java package com.siqi.xml; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; /** * 要用sax解析,需要实现一个ParseHandler * @author siqi * */ public class SaxParseHandler extends DefaultHandler{ /** * 重写了DefaultHandler中的startElement函数,每解析到 * 一个元素(element)的时候都会触发这个函数,并且将这个element * 的属性attributes和值value当作参数传进来。除了startElement, * 还有startDocument,endDOucment,endElement,要根据需要 * 重写这些函数。 */ @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { //打印element的基本信息,qName System.out.println("Element qName : "+qName); System.out.println("Element localName: "+localName); System.out.println("Element uri : "+uri); //打印element的所有属性attributes for(int i=0; i<attributes.getLength(); i++) { System.out.println(""); System.out.println(" attribute qName : "+attributes.getQName(i)); System.out.println(" attribute localName: "+attributes.getLocalName(i)); System.out.println(" attribute value : "+attributes.getValue(i)); System.out.println(" attribute uri : "+attributes.getURI(i)); } System.out.println(""); super.startElement(uri, localName, qName, attributes); } } sample.xml的内容最上面那个xml 执行结果: parse xml file use sax2 Element qName : websites Element localName: websites Element uri : Element qName : sina:website Element localName: website Element uri : http://www.sina.com attribute qName : sina:blog attribute localName: blog attribute value : blog.sina.com attribute uri : http://www.sina.com Element qName : baidu:website Element localName: website Element uri : http://www.baidu.com attribute qName : baidu:blog attribute localName: blog attribute value : hi.baidu.com attribute uri : http://www.baidu.com parse xml file use sax Element qName : websites Element localName: Element uri : attribute qName : xmlns:sina attribute localName: xmlns:sina attribute value : http://www.sina.com attribute uri : attribute qName : xmlns:baidu attribute localName: xmlns:baidu attribute value : http://www.baidu.com attribute uri : Element qName : sina:website Element localName: Element uri : attribute qName : sina:blog attribute localName: sina:blog attribute value : blog.sina.com attribute uri : Element qName : baidu:website Element localName: Element uri : attribute qName : baidu:blog attribute localName: baidu:blog attribute value : hi.baidu.com attribute uri : 对于sax2,正确的解析出了qName,LocalName和uri。sax不能识别出前缀和uri,qName=localName。

  

 

 

第三,以JDOM的方式实现。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
package xmls;
import org.jdom2.Attribute;
import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.JDOMException;
import org.jdom2.input.JDOMParseException;
import org.jdom2.input.SAXBuilder;
import java.io.*;
import java.util.List;
/**
 * Created by lenovo on 2017-6-2.
 */
public class JDOMTest {
  public static void main(String[] args){
    SAXBuilder saxBuilder = new SAXBuilder();
    InputStream in;
    try{
      in = new FileInputStream(new File("src\\xmls\\book.xml"));
      Document document = saxBuilder.build(in);
      Element rootElement = document.getRootElement();
      List<Element> bookList = rootElement.getChildren();
      for(Element book: bookList){
        System.out.println("第" + (bookList.indexOf(book)+1) + "本书!");
        List<Attribute> attrs = book.getAttributes();
        for(Attribute attr: attrs){
          System.out.println(attr.getName() + "=" + attr.getValue());
        }
        for(Element item: book.getChildren()){
          System.out.println(item.getName() + ":" + item.getValue());
        }
        System.out.println("------------------------------------");
      }
    }catch (FileNotFoundException e){
      e.printStackTrace();
    }catch (JDOMException e){
      e.printStackTrace();
    }catch (IOException e){
      e.printStackTrace();
    }
  }
}

第四,以DOM4J的方式实现。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
package xmls;
import org.dom4j.*;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.Iterator;
import java.util.List;
/**
 * Created by lenovo on 2017-6-2.
 */
public class DOM4JTest {
  public void parseXML(){
    SAXReader saxReader = new SAXReader();
    try{
      Document document = saxReader.read(new File("src\\xmls\\book.xml"));
      Element rootElement = document.getRootElement();
      Iterator it = rootElement.elementIterator();
      while (it.hasNext()){
        Element book = (Element)it.next();
        List<Attribute> attrs = book.attributes();
        for(Attribute attr: attrs){
          System.out.println("属性名:" + attr.getName() + "---- 属性值:" + attr.getValue() );
        }
        Iterator cit = book.elementIterator();
        while (cit.hasNext()){
          Element child = (Element) cit.next();
          System.out.println("子节点:" + child.getName());
        }
      }
    }catch (DocumentException e){
      e.printStackTrace();
    }
  }
  public static void main(String[] args){
    DOM4JTest dom4JTest = new DOM4JTest();
    dom4JTest.parseXML();
  }
}

以上这篇java读取XML文件的四种方法总结(必看篇)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

 

 

 

 

posted @ 2021-12-20 16:53  kelelipeng  阅读(16931)  评论(0编辑  收藏  举报