05XML

Posted on 2019-02-05 16:46 心默默言阅读(143) 评论(0) 编辑收藏举报

回到顶部

1.XML入门

1.1 引入

HTML, 超文本标记语言。

html语言语法是很松散的！

1）标签不区分大小写的！

2）标签可以不匹配的。

由w3c组织，针对html的语法缺陷，去设计了另一门，叫xml语言。

html语言的标签是固定的。

1.2 XML语言

XML：, Extend Markup lanuage 可扩展标记语言。

HTML XML

概念超文本标记语言可扩展标记语言

标记数量是固定的是不固定的，可扩展的

作用负责网页的结构

1）描述带关系的数据结构（作为软件的配置文件）

配置使用场景：

1）框架（struts2 ， hibernate，spring），xml作为框架的配置文件

2）tomcat服务器软件配置文件（web.xml server.xml）

2）装载数据（作为小型的“数据库”）。

1.3组成部分

1. 文档声明
　　1. 格式：<?xml 属性列表 ?>
　　2. 属性列表：
　　　　* version：版本号，必须的属性
　　　　* encoding：编码方式。告知解析引擎当前文档使用的字符集，默认值：ISO-8859-1
　　　　* standalone：是否独立
　　　　　　* 取值：
　　　　　　　　* yes：不依赖其他文件
　　　　　　　　* no：依赖其他文件
2. 指令(了解)：结合css的
　　* <?xml-stylesheet type="text/css" href="a.css" ?>
3. 标签：标签名称自定义的
　　* 规则：
　　　　* 名称可以包含字母、数字以及其他的字符
　　　　* 名称不能以数字或者标点符号开始
　　　　* 名称不能以字母 xml（或者 XML、Xml 等等）开始
　　　　* 名称不能包含空格

回到顶部

2.XML作用

2.1 作为软件配置文件

PCweb服务器：学生管理系统 - > 添加学生 -> name=张三,age=20 -》提交到后台程序 - 》把数据存储到数据库中

两台通讯条件；

IP地址和端口

java代码：

根据ip和端口连接数据库服务器(ip改动会改变代码)

properties文件：

ip=211.34.21.43

port=20

xml文件：
                    <host-list>
                        <host id="main">
                            <ip> 211.34.21.43</ip>
                            <port>20</port>
                        </host>
                        <host id="backup">
                            <ip> 211.34.21.44</ip>
                            <port>20</port>
                        </host>
                    </host-list>

PC数据库服务器1：oracle数据库 211.34.21.43 20

PC数据库服务器2：oracle数据库 211.34.21.44 20

2.2 作为小型数据库

教师管理系统教师信息：姓名工龄邮箱地址

传输数据：

字符串：张|三|20|zhangsan@qq.com|.......|.... （格式不是行业规范的，不通用）

xml格式：

         <teacher-list>

                <teacher>

                       <name></name>

                       <email></email>

                       <workage></workage>

                        ....

                </teacher>

                <teacher>

                    <name></name>

                    <email></email>

                    <workage></workage>

                     ....

              </teacher>
        <teacher-list>              （xml是w3c组织的制定的标准）

财务系统

发邮件给教师：

邮箱地址姓名

方案1：财务系统中也存储了一套教师信息。数据维护成本比较高了！！！

方案2：财务系统使用的教师数据从教师管理系统中发送过去的。

回到顶部

3.XML语法

3.1 标签

注意：

1）分带标签体的标签，也有空标签。

2）标签是区分大小写

3）标签一定要配对

4）标签中间不能含有空格

5）不能使用数字开头

6）如果没有指定名称空间的话，标签名中间不能含有冒号

7）在同一个xml文件中，有且仅有一个根标签

3.2 属性

注意：

1）一个属性分为属性名和属性值。属性名和值之间使用=号分割。

2）属性值一定要使用单引号或者双引号包含，不能省略，也不能单双混用！

3）一个标签内可以包含多个属性，但是不能出现同名的属性

3.3 注释

3.4 文档声明

<?xml version="1.0" encoding="码表"?>

version: xml的版本号，必须要写

encoding：表示解析xml文件内容时使用的码表

xml文件的编码问题：

1）xml文件内容保存的编码（另存为-》选择编码保存）

2）解析xml文件内容的编码( <?xml version="1.0" encoding="utf-8"?> )

以上两个编码必须保存一致，才能避免中文乱码问题。

注意：

如果在ecplise开发工具上，编写xml文件，那么xml文件内容自动按照文档声明的encoding的编码保存，所以不会中文乱码问题.

3.5 转义字符

和html的转义字符.

3.6 CDATA块

把CDATA块中的内容全部原样输入

3.7 约束

规定xml文档的书写规则
　　作为框架的使用者(程序员)：
　　　　1. 能够在xml中引入约束文档
　　　　2. 能够简单的读懂约束文档

分类：

1. DTD:一种简单的约束技术
2. Schema:一种复杂的约束技术

#student.dtd
<!ELEMENT students (student*) >
<!ELEMENT student (name,age,sex)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!ATTLIST student number ID #REQUIRED>

引入dtd文档到xml文档中
　　内部dtd：将约束规则定义在xml文档中
　　外部dtd：将约束的规则定义在外部的dtd文件中
　　　　本地：<!DOCTYPE 根标签名 SYSTEM "dtd文件的位置">
　　　　网络：<!DOCTYPE 根标签名 PUBLIC "dtd文件名字" "dtd文件的位置URL">

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE students SYSTEM "student.dtd">

<students>
    <student number="itcast_0001">
        <name>tom</name>
        <age>18</age>
        <sex>male</sex>
    </student>
    
</students>

Schema:
　　引入：
　　　　1.填写xml文档的根元素
　　　　2.引入xsi前缀. xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
　　　　3.引入xsd文件命名空间. xsi:schemaLocation="http://www.itcast.cn/xml student.xsd"
　　　　4.为每一个xsd约束声明一个前缀,作为标识 xmlns="http://www.itcast.cn/xml"

<?xml version="1.0"?>
<xsd:schema xmlns="http://www.itcast.cn/xml"
        xmlns:xsd="http://www.w3.org/2001/XMLSchema"
        targetNamespace="http://www.itcast.cn/xml" elementFormDefault="qualified">
    <xsd:element name="students" type="studentsType"/>
    <xsd:complexType name="studentsType">
        <xsd:sequence>
            <xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
        </xsd:sequence>
    </xsd:complexType>
    <xsd:complexType name="studentType">
        <xsd:sequence>
            <xsd:element name="name" type="xsd:string"/>
            <xsd:element name="age" type="ageType" />
            <xsd:element name="sex" type="sexType" />
        </xsd:sequence>
        <xsd:attribute name="number" type="numberType" use="required"/>
    </xsd:complexType>
    <xsd:simpleType name="sexType">
        <xsd:restriction base="xsd:string">
            <xsd:enumeration value="male"/>
            <xsd:enumeration value="female"/>
        </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType name="ageType">
        <xsd:restriction base="xsd:integer">
            <xsd:minInclusive value="0"/>
            <xsd:maxInclusive value="256"/>
        </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType name="numberType">
        <xsd:restriction base="xsd:string">
            <xsd:pattern value="heima_\d{4}"/>
        </xsd:restriction>
    </xsd:simpleType>
</xsd:schema>

<?xml version="1.0" encoding="UTF-8" ?>
<!-- 
    1.填写xml文档的根元素
    2.引入xsi前缀.  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    3.引入xsd文件命名空间.  xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd"
    4.为每一个xsd约束声明一个前缀,作为标识  xmlns="http://www.itcast.cn/xml" 
    
    
 -->
 <students   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
              xmlns="http://www.itcast.cn/xml" 
            xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd"
             >
     <student number="heima_0001">
         <name>tom</name>
         <age>18</age>
         <sex>male</sex>
     </student>
         
 </students>

回到顶部

4.XML解析

4.1xml解析方式

1）DOM解析：将标记语言文档一次性加载进内存，在内存中形成一颗DOM树

　　优点：操作方便，可以对文档进行CRUD的所有操作。

　　缺点：占内存。

2）SAX解析：逐行读取，基于事件驱动的。　　

　　优点：不占内存。

　　缺点：只能读取，不能写（增删改）。

4.2DOM解析的工具

jaxp：sun公司提供的解析器，支持dom和sax两种思想。

jsoup： jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。

PULL：Android操作系统内置的解析器，sax方式的。

dom4j工具：三大框架读取xml文件的程序。（非官方的，第三方的）

dom for java

4.3dom4j工具使用

1）到dom4j的官方下载。dom4j-1.6.1.zip

2)导入dom4j的支持jar包、

dom4j-1.6.1.jar核心包

4.4使用dom4j读取xml的标签

<?xml version="1.0" encoding="utf-8" ?>
<!--<contact
        id = "001"
        name="张三"
        gender="男"
        phone="13411112222"
        email="zhangsan@qq.com"
        address="广州天河">
</contact>-->
<contact-list>
    <contact id="001">
        <name>张三</name>
        <gender>男</gender>
        <phone>13411112222</phone>
        <email>zhangsan@qq.com</email>
        <address>广州天河</address>
    </contact>
    <contact id="002">
        <name>李四</name>
        <gender>女</gender>
        <phone>13511112222</phone>
        <email>lisi@qq.com</email>
        <address>广州越秀</address>
    </contact>
    <student> </student>
</contact-list>

package cn.jxufe.java.chapter01;

import java.io.File;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

/**
 * 使用dom4j工具读取一个xml文件
 * 
 * @author zhao
 *
 */
public class w01demo {

    /*
     * 使用dom4j读取xml的标签
     *      getRootElement(): 获取根标签
     *      getName(): 获取标签名称
     *      element("名称")： 获取第一个指定名称的子标签
     *      elements("名称"): 获取指定名称的所有的子标签
     *      elements(): 获取所有子标签
     */
    public static void main(String[] args) throws DocumentException {
        // TODO Auto-generated method stub
        SAXReader reader = new SAXReader();// 2)读取xml文件
        Document doc = reader.read(new File("./src/contact.xml"));
        System.out.println(doc);
        /**
         * 读取标签
         */
        // 1.1 读取根标签
        Element rootElem = doc.getRootElement();
        System.out.println(rootElem);

        // 1.2 获取标签名称
        System.out.println(rootElem.getName());
        // 1.3 获取第一个子标签(根据指定的名称获取第一个子标签)
        Element conElem = rootElem.element("contact");
        System.out.println(conElem.getName());
        System.out.println(conElem);
        System.out.println("==============");
        // 1.4 获取所有子标签（根据指定的名称获取所有同名子标签）
        List<Element> list = rootElem.elements("contact");
        // 遍历List
        // 几种方式?
        // 1)传统for循环
        /*for(int i=0;i<list.size();i++){
            list.get(i); //根据角标获取指定对象
        }*/

        // 2)for-each循环
        for (Element e : list) {
            System.out.println(e);
        }

        // 3)迭代器
        /*Iterator it = list.iterator();
        while(it.hasNext()){ //hasNext(): 判断是否有下一个元素
            it.next(); //next():取出当前对象
        }*/

        System.out.println("================");

        // 1.4 获取所有子标签（不指定名称）
        List<Element> eList = rootElem.elements();
        for (Element e : eList) {
            System.out.println(e);
        }
        System.out.println("===========");

    }

}

4.5使用dom4j获取xml上的属性信息

package cn.jxufe.java.chapter01;

import java.io.File;
import java.util.List;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

/**
 * 使用dom4j获取xml上的属性信息
 * 
 * @author zhao
 *
 */
public class w02demo {
    public static void main(String[] args) throws DocumentException {
        // 1)创建xml解析器
        SAXReader reader = new SAXReader();
        Document doc = reader.read(new File("./src/contact.xml"));

        /**
         * 读取属性 注意：获取属性，必须先得到属性所在的标签
         */
        Element conElem = doc.getRootElement().element("contact");
        // 1.1 在标签上获取属性值(根据属性名称获取对应的属性值)

        String value = conElem.attributeValue("id");
        System.out.println(value);

        Element conElem2 = (Element) doc.getRootElement().elements().get(1);// 返回的是object，强转
        System.out.println(conElem2.attributeValue("id"));

        // 1.2 根据属性名称获取属性对象
        // 拿到标签对象
        conElem = doc.getRootElement().element("contact");
        // 拿到属性对象
        Attribute idAttr = conElem.attribute("id");
        // 通过属性对象拿到 属性名
        String idName = idAttr.getName();
        // 通过属性对象拿到 属性值
        String idValue = idAttr.getValue();
        System.out.println(idName + "=" + idValue);

        Element conElem3 = (Element) doc.getRootElement().elements().get(1);
        // 拿到属性对象
        Attribute idAttr2 = conElem3.attribute("id");
        // 通过属性对象拿到 属性名
        String idName2 = idAttr2.getName();
        // 通过属性对象拿到 属性值
        String idValue2 = idAttr2.getValue();
        System.out.println(idName2 + "=" + idValue2);
        System.out.println("=====================");
        // 1.3 获取标签的所有属性对象
        conElem = doc.getRootElement().element("contact");
        List<Attribute> attrList = conElem.attributes();
        for (Attribute attr : attrList) {
            System.out.println(attr.getName() + "=" + attr.getValue());
        }
    }
}

4.6使用dom4j获取xml的文本信息

package cn.jxufe.java.chapter01;

import java.io.File;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

/**
 * 使用dom4j获取xml的文本信息
 * 
 * @author zhao
 *
 */
public class w03demo {

    public static void main(String[] args) throws DocumentException {
        // TODO Auto-generated method stub
        SAXReader reader = new SAXReader();
        Document doc = reader.read(new File("./src/contact.xml"));
        
        /**
         * 注意： 在xml文件中，空格和换行会作为xml的内容被解析到。 xml中空格和换行和java代码中空格换行不一样。
         * java代码中的空格和换行是没意义的，为了代码的格式格式好看而已。
         */
        Element con = doc.getRootElement().element("contact");
        System.out.println(con.getText());
        
        /**
         * 读取文本： 注意： 获取文本，要先获取文本所在的标签对象
         */
        // 1.1 拿到所在标签上的文本内容
        Element nameElem = doc.getRootElement().element("contact").element("name");
        String content = nameElem.getText();
        System.out.println(content);

        // 1.2 通过父标签获取指定子标签的文本内容
        Element conElem = doc.getRootElement().element("contact");
        content = conElem.elementText("gender");
        System.out.println(content);
    }

}

4.7使用dom4j把xml文件的信息封装成对象

package cn.jxufe.java.chapter01;

import java.io.File;
import java.util.ArrayList;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

/**
 * 使用dom4j把xml文件的信息封装成对象
 * 
 * @author zhao
 *
 */
public class w04demo {

    public static void main(String[] args) throws DocumentException {
        // TODO Auto-generated method stub
        // 目标： contact.xml信息 -> List集合
        // 1）读取xml文件
        SAXReader reader = new SAXReader();
        Document doc = reader.read(new File("./src/contact.xml"));

        // 2)创建List对象
        List<Contact> list = new ArrayList<Contact>(); // List接口-》 ArrayList/LinkedList/Vector

        // 3)把xml信息->list对象
        // 3.1 读取到所有contact标签
        List<Element> conList = doc.getRootElement().elements("contact");
        for (Element elem : conList) {
            // 3.2 创建Contact对象
            Contact con = new Contact();

            // 3.3 把contact标签数据放入contact对象中
            con.setId(elem.attributeValue("id"));
            con.setName(elem.elementText("name"));
            con.setGender(elem.elementText("gender"));
            con.setPhone(elem.elementText("phone"));
            con.setEmail(elem.elementText("email"));
            con.setAddress(elem.elementText("address"));

            // 3.4 把contact对象放入list对象
            // 保存数据 list.add(对象)
            list.add(con);
        }

        // 4)输出
        for (Contact con : list) {
            System.out.println(con);
        }
    }

}

4.8写出一个xml文件

package cn.jxufe.java.chapter02;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;

/*
 * 写出一个xml文件
 */
public class T01demo {

    public static void main(String[] args) throws IOException, DocumentException {
        // TODO Auto-generated method stub
        /*
         * 修改xml信息的步骤
         * 1）读取到原来的xml文件（document对象）
         * 2）操作document对象，改变xml信息（docuement对象）
         * 3）把修改后的document对象写出到xml文件中（覆盖原来的文件）
         */

        Document doc = new SAXReader().read(new File("./src/contact.xml"));
        /*
         * 输出流
         *       字符输出流： 
         *          Writer ->  FileWriter/BufferedWriter
         *                 方法：
         *                     write(char c)： 写出一个字符
         *                     write(char[] data): 写出多个字符
         *                     write(String str): 写出一个字符串  
         *       字节输出流
         *          OutputStream -> FileOutputStream/BufferedOutputStream/ObjectOutputStream
         *                     write(byte) :写出一个字节
         *                     write(byte[] data): 写出多个字节
         */
        /**
         * 把内存的document对象写出到硬盘的xml文件
         */
        // 创建输出流
        OutputStream outStream = new FileOutputStream("e:/contact.xml");
        // 1)创建输出对象
        XMLWriter writer = new XMLWriter(outStream);
        // 2)写出数据
        writer.write(doc);
    }

}

4.9写出xml文件的细节

package cn.jxufe.java.chapter02;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;

/**
 * 写出xml文件的细节
 * 
 * @author zhao
 *
 */
public class T02demo {
    public static void main(String[] args) throws DocumentException, IOException {
        Document doc = new SAXReader().read(new File("./src/contact.xml"));

        // 创建输出流
        OutputStream outStream = new FileOutputStream("e:/contact.xml");
        // 一、设置输出的格式
         OutputFormat format = OutputFormat.createCompactFormat();//紧凑的格式.空格和换行去掉了！！
        // 系统上线了使用
//        OutputFormat format = OutputFormat.createPrettyPrint();// 漂亮的格式。包含空格和换行。 测试时使用
        // 二、 设置输出的编码格式
        /*
         * 作用： 1)影响了xml的文档声明的encoding编码 
         *      2)影响了xml内容保存的编码
         */
        format.setEncoding("gbk");

        // 1)创建输出对象
        XMLWriter writer = new XMLWriter(outStream, format);
        // 2)写出数据
        writer.write(doc);
    }
}

4.10对XML进行增删改查

package cn.jxufe.java.chapter02;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;

public class T03demo {
    /*
     * 查：
            标签： element("name")  
                            elements("name")
                            elements();
                            getName（） 标签名称
                            getRootElement(): 根标签
            属性： atrributeValue("name")  属性值
                            atrribute("name")  对象
                            atrributes()  属性对象列表
                            getName() : 属性名
                            getValue() 属性值
            文本：
                          getText();  当前标签的文本
                          elementText("name")  子标签的文本
                        
           增：
            DocumentHelper.createDocument()   文档
            addElement("name");   标签
            addAtribute（"name","value" ）  属性
            
            改：
            setValue()   修改属性值
            addAttribute（”同名“） 修改属性值
            setText()    修改文本内容
    
             删除：
            detach()   标签、属性
            getParent().remove(标签/属性)
    
     */
    public static void main(String[] args) throws Exception {
        // TODO Auto-generated method stub
//        add();
//        edit();
        delete();

    }

    public static void add() throws IOException {
        // 1.1 添加空文档
        Document document = DocumentHelper.createDocument();
        // 1.2 添加标签
        Element conListElement = document.addElement("contact-list");
        Element conElement = conListElement.addElement("contact");
        conElement.addElement("name");

        // 1.3 添加属性
        conElement.addAttribute("id", "001");
        conElement.addAttribute("name", "eric");

        // 把文档写出到xml文件中
        OutputStream out = new FileOutputStream("e:/contact.xml");
        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");

        XMLWriter writer = new XMLWriter(out, format);
        writer.write(document);
    }

    public static void edit() throws DocumentException, IOException {
        Document doc = new SAXReader().read(new File("./src/contact.xml"));
        // 修改属性
//        // 1.1 先得到属性对象，再调用方法修改属性值
//        Element conElem = doc.getRootElement().element("contact");
//        Attribute idAttr = conElem.attribute("id");
//        idAttr.setValue("003");

        // 1.2 在标签中添加同名的属性，覆盖属性值
        Element conElem = doc.getRootElement().element("contact");
        conElem.addAttribute("id", "004");

        // 修改文本
        Element nameElem = doc.getRootElement().element("contact").element("name");
        nameElem.setText("王五");

        // 把文档写出到XML中
        OutputStream out = new FileOutputStream("e:/contact.xml");
        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");
        XMLWriter writer = new XMLWriter(out, format);
        writer.write(doc);
    }

    public static void delete() throws DocumentException, Exception {
        Document doc = new SAXReader().read(new File("./src/contact.xml"));
        // 1.1 删除标签
        Element conElem = doc.getRootElement().element("contact");
        conElem.detach(); // 自杀
//        conElem.getParent().remove(conElem); // 他杀

//        // 1.2 删除属性
        Attribute idAttr = doc.getRootElement().element("contact").attribute("id");
        idAttr.detach();

        // 把文档写出到xml文件中
        OutputStream out = new FileOutputStream("e:/contact.xml");
        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");

        XMLWriter writer = new XMLWriter(out, format);
        writer.write(doc);
    }
}

回到顶部

5.xPath技术

5.1引入

问题：当使用dom4j查询比较深的层次结构的节点（标签，属性，文本），比较麻烦！！！

5.2xPath作用

主要是用于快速获取所需的节点对象。

5.3在dom4j中如何使用xPath技术

1）导入xPath支持jar包。 jaxen-1.1-beta-6.jar

2）使用xpath方法

　　List<Node> selectNodes("xpath表达式"); 查询多个节点对象

　　Node selectSingleNode("xpath表达式"); 查询一个节点对象

<?xml version="1.0" encoding="utf-8" ?>
<contact-list>
    <contact id="001" font="s">
        <name>张三</name>
        <gender>男</gender>
        <phone>13411112222</phone>
        <email>zhangsan@qq.com</email>
        <address>广州天河</address>
    </contact>
    <contact id="002">
        <name>李四</name>
        <gender>女</gender>
        <phone>13511112222</phone>
        <email>lisi@qq.com</email>
        <address>广州越秀</address>
    </contact>
    <student> 
    </student>
</contact-list>

package dom4j_xPath;

import java.io.File;
import java.io.FileOutputStream;

import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;

public class Demo1 {

    public static void main(String[] args) throws Exception {
        /*
         * 需求：删除id为002的标签
         */
        Document doc = new SAXReader().read(new File("d:/contact.xml"));
        //1.查询id为002的标签
        Element contactElem = (Element) doc.selectSingleNode("//contact[@id='002']");

        //2.删除标签
        contactElem.detach();

        OutputFormat format = OutputFormat.createPrettyPrint();//漂亮的格式,有空格和换行,开发、调试的时候用
        FileOutputStream out = new FileOutputStream("d:/contact.xml");
        format.setEncoding("utf-8");
        XMLWriter writer = new XMLWriter(out, format);
        writer.write(doc);
        writer.close();

    }
}

结果：

<?xml version="1.0" encoding="utf-8"?>

<contact-list> 
  <contact id="001" font="s"> 
    <name>张三</name>  
    <gender>男</gender>  
    <phone>13411112222</phone>  
    <email>zhangsan@qq.com</email>  
    <address>广州天河</address> 
  </contact>  
  <student></student> 
</contact-list>

5.4xPath语法

/ 绝对路径表示从xml的根位置开始或子元素（一个层次结构）

// 相对路径表示不分任何层次结构的选择元素。

* 通配符表示匹配所有元素

[] 条件表示选择什么条件下的元素

@ 属性表示选择属性节点

and 关系表示条件的与关系（等价于&&）

text() 文本表示选择文本内容

回到顶部

6.SAX解析

6.1回顾DOM解析

DOM解析原理：一次性把xml文档加载进内存，然后在内存中构建Document树。

　　对内存要求比较高。

　　缺点：不适合读取大容量的xml文件，容易导致内存溢出。

SAX解析原理：加载一点，读取一点，处理一点。对内存要求比较低。

6.2SAX解析工具

SAX解析工具- Sun公司提供的。内置在jdk中。org.xml.sax.*

核心的API：

　　SAXParser类：用于读取和解析xml文件对象

　　　　parse（File f, DefaultHandler dh）方法：解析xml文件

　　　　　　参数一： File：表示读取的xml文件。

　　　　　　参数二： DefaultHandler： SAX事件处理程序。使用DefaultHandler的子类

package sax;

import java.io.File;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class Demo1 {
    public static void main(String[] args) throws Exception {
        //1.创建SAXParser对象
        SAXParser parser = SAXParserFactory.newInstance().newSAXParser();

        //2.调用parse方法
        /*
         * 参数一：xml文档
         * 参数二：DefaultHandler
         */
        parser.parse(new File("./src/contact.xml"), new MyDefaultHandler());

    }
}

/**
 * SAX处理程序
 */
class MyDefaultHandler extends DefaultHandler {

    /*
     * 开始文档时调用
     */
    @Override
    public void startDocument() throws SAXException {
        System.out.println("MyDefaultHandler.startDocument()");
    }

    /**
     * 开始标签调用
     * @param qName:表示开始标签的签名
     * @param attributes:表示开始标签内包含的属性列表
     */
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        System.out.println("MyDefaultHandler.startElement()" + qName);
    }

    /**
     * 结束标签调用
     * 
     */
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        System.out.println("MyDefaultHandler.endElement()  " + qName);
    }

    /**
     * 读到文本内容的时候调用
     * @param ch:表示xml的所有的文本内容
     * @param start：表示当前文本内容的开始位置
     * @param length：表示当前文本内容的长度
     */
    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        String content = new String(ch,start,length);
        System.out.println("MyDefaultHandler.characters()  "+content);
    }

    /*
     * 结束文档时调用
     */
    @Override
    public void endDocument() throws SAXException {
        System.out.println("MyDefaultHandler.endDocument()");
    }
}

输出：

MyDefaultHandler.startDocument()
MyDefaultHandler.startElement()  contact-list
MyDefaultHandler.characters()  
    
MyDefaultHandler.startElement()  contact
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  name
MyDefaultHandler.characters()  张三
MyDefaultHandler.endElement()  name
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  gender
MyDefaultHandler.characters()  男
MyDefaultHandler.endElement()  gender
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  phone
MyDefaultHandler.characters()  13411112222
MyDefaultHandler.endElement()  phone
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  email
MyDefaultHandler.characters()  zhangsan@qq.com
MyDefaultHandler.endElement()  email
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  address
MyDefaultHandler.characters()  广州天河
MyDefaultHandler.endElement()  address
MyDefaultHandler.characters()  
    
MyDefaultHandler.endElement()  contact
MyDefaultHandler.characters()  
    
MyDefaultHandler.startElement()  contact
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  name
MyDefaultHandler.characters()  李四
MyDefaultHandler.endElement()  name
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  gender
MyDefaultHandler.characters()  女
MyDefaultHandler.endElement()  gender
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  phone
MyDefaultHandler.characters()  13511112222
MyDefaultHandler.endElement()  phone
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  email
MyDefaultHandler.characters()  lisi@qq.com
MyDefaultHandler.endElement()  email
MyDefaultHandler.characters()  
        
MyDefaultHandler.startElement()  address
MyDefaultHandler.characters()  广州越秀
MyDefaultHandler.endElement()  address
MyDefaultHandler.characters()  
    
MyDefaultHandler.endElement()  contact
MyDefaultHandler.characters()  
    
MyDefaultHandler.startElement()  student
MyDefaultHandler.characters()   
    
MyDefaultHandler.endElement()  student
MyDefaultHandler.characters()  

MyDefaultHandler.endElement()  contact-list
MyDefaultHandler.endDocument()

案例：

package sax;

import java.io.File;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import com.sun.org.apache.xerces.internal.xni.QName;

/**
 * 案例：以文本的原格式读取内容到内存
 */
public class Demo2 {
    public static void main(String[] args) throws Exception {
        //1.创建SAXParser对象
        SAXParser parser = SAXParserFactory.newInstance().newSAXParser();

        //2.调用parse方法
        /*
         * 参数一：xml文档
         * 参数二：DefaultHandler
         * 
         */
        MyDefaultHandler2 handler = new MyDefaultHandler2();
        parser.parse(new File("./src/contact.xml"), handler);
        String content = handler.getContent();
        System.out.println(content);

    }
}

/**
 * SAX处理程序
 */
class MyDefaultHandler2 extends DefaultHandler {
    private StringBuffer sb = new StringBuffer();

    public String getContent() {
        return sb.toString();
    }

    /**
     * 开始标签调用
     * @param qName:表示开始标签的签名
     * @param attributes:表示开始标签内包含的属性列表
     */
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        sb.append("<" + qName);
        //判断是否有属性
        if (attributes != null) {
            for (int i = 0; i < attributes.getLength(); i++) {
                String attrName = attributes.getQName(i);
                String attrValue = attributes.getValue(i);
                sb.append(" " + attrName + "=\"" + attrValue + "\"");
            }
        }
        sb.append(">");
    }

    /**
     * 结束标签调用
     * 
     */
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        sb.append("</" + qName);
    }

    /**
     * 读到文本内容的时候调用
     * @param ch:表示xml的所有的文本内容
     * @param start：表示当前文本内容的开始位置
     * @param length：表示当前文本内容的长度
     */
    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        String content = new String(ch, start, length);
        sb.append(content);
    }

}

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· .NET10 - 预览版1新功能体验（一）

心默默言

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

最新评论

05XML

1.XML入门

1.1 引入

1.2 XML语言

1.3组成部分

2.XML作用

2.1 作为软件配置文件

2.2 作为小型数据库

3.XML语法

3.1 标签

3.2 属性

3.3 注释

3.4 文档声明

3.5 转义字符

3.6 CDATA块

3.7 约束

4.XML解析

4.1xml解析方式

4.2DOM解析的工具

4.3dom4j工具使用

4.4使用dom4j读取xml的标签

4.5使用dom4j获取xml上的属性信息

4.6使用dom4j获取xml的文本信息

4.7使用dom4j把xml文件的信息封装成对象

4.8写出一个xml文件

4.9写出xml文件的细节

4.10对XML进行增删改查

5.xPath技术

5.1引入

5.2xPath作用

5.3在dom4j中如何使用xPath技术

5.4xPath语法

6.SAX解析

6.1回顾DOM解析

6.2SAX解析工具