Javaweb学习笔记——(六)——————xml中jaxp两种解析方式和dom4j运用

1.xml的scheam约束
dtd的语法:<!ElEMENT 元素名称 约束>
**schema符合xml的语法,xml语句
**一个xml中可以有多个schema,多个schema使用名称空间区分(类似于Java的包名)
**dtd里面有PADATA类型,但是在schema里面可以支持更多的数据类型
***比如 年龄 只能是整数,在schema可以直接定义一个整数类型

*** schema语法更加复杂,schema还不能替代dtd


2.schema的快速入门
*创建一个schema文件
**根节点:<schema>
*步骤
(1)看xml中有多少个元素
<element>


**在schema文件里面
**属性 xmlns="http://www.w3.org/2001/XMLSchema" 
-表示当前xml文件是一个约束文件
targetNamespace="http://www.example.org/1"
-使用schema约束文件,直接通过这个地址引入约束文件 
elementFormDefault="qualified"


步骤
(1)看xml中有多少个元素
<element>
(2)看简单元素和复杂元素
*如果复杂元素
<complexType>
<sequence>
子元素
</sequence>
</complexType>


(3)如果简单元素,写在复杂元素的
<element name="person">
<complexType>
<sequence>
<element name="name" type="string"></element>
<element name="age" type="int"></element>
</sequence>
</complexType>
</element>


(4)在被约束文件里面引入约束文件
<person xmlns:xsi="http://www.w3.org/2001/XMLSchema"
xmlns="http://www.example.org/1"
xsi:schemaLocation="http://www.example.org/1 1.xsd">


**xmlns:xsi="http://www.w3.org/2001/XMLSchema"
--表示xml是一个被约束文件


**xmlns="http://www.example.org/1"
--是约束文档里面 targetNamespace
**xsi:schemaLocation="http://www.example.org/1 1.xsd"
--targetNamespace 空格 约束文档的地址路径


*<Sequance>:表示元素的出现的顺序
<all>:元素只能出现一次
<choice>:元素只能出现其中的一个
maxOccurs="unbounded":表示元素的出现的次数
<any></any>:表示任意元素


*可以约束属性
*写在复杂元素里面
***写在 </complexType>之前
--
<attribute name="id1" type="int" use="required"></attribute>
-name:属性名称
-type:属性类型 int string
-use:属性是否必须出现required


*复杂的schema约束
<company xmlns = "http://www.w3.org/2001/XMLSchema"
xmlns:dept="http://www.example.org/department"
xmlns:xsi="http://www.w3.org/2001/XMLScema-instance"
xsi:schemaLocation="http://www.example.org/company company.xsd http://www.example.org/departent department.xsd"
>


*引入多个schema文件,可以给每个起一个别名


<employee age="30">
部门名称
<dept:name>100</dept:name>
*想要引入部门的约束文件里面的name,使用部门的别名 detp:元素名称
员工名称
<name>王晓晓</name>
</employee>


3.sax解析的原理
*解析xml有两种技术 dom和sax


*根据xml中的层级结构在内存中分配一个树形结构
**把xml中标签,树形,文本封装成对象


*sax方式:事件驱动,边读边解析
*在javax.xml.parsers包里面
** SAXParser
此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得
-parse(File f, DefaultHandler dh)
*两个参数
**第一参数:xml的路径
*事件处理器
** SAXParserFactory 
实例 newInstance() 方法得到
*画图分析一下sax执行过程
*当解析到开始标签的时候,自动执行startElement方法
*当解析到文本的时候,自动执行characters方法
*当解析到结束标签的时候,自动执行endElement方法


4.使用jaxp的sax方式解析xml
*sax方式不能实现增删改查操作,只能做查询操作
**打印出整个文档
***回写parse方法,第一个参数xml路径,第二个参数 事件处理器
***创建一个类,继承事件处理器的类
***重写里面的三个方法


*获取到所有的name元素的值
**定义一个成员变量 flag = false
**判断开始方法是否是name元素,如果是name元素,把flag值设置为true
**如果flag值为true,才characters方法里面打印内容
**当执行到结束方法的时候吧flag值设置成false


*获取到第一个name元素的值
**定义一个成员变量 index = 1
**在结束方法时候,将 index++
**想要打印出第一个name元素的值,
-在characters方法里面判断
--判断flag=true 并且 index == 1,再打印内容


5.使用dom4j解析xml
*dom4j,是一个组织,针对xml解析,提供解析器 dom4j


*dom4j不是javase的一部分,想要使用第一步需要怎么做?
***导入dom4j提供jar包
--创建一个文件夹lib
--复制jar包到lib下面
--右击jar包,build path——add to buildpath
--看到jar包,变成奶瓶样子,表示导入成功


*得到document
SAXReader reader = new SAXReader();
Document document = reader.read(url);
*document的父接口是Node
*如果在document里面找不到想要的方法,到Node里面去找


*document里面的方法:getRootRlement():获取根节点 返回的是Element


*Element也是一个接口,父接口是Node
-Element和Node里面的方法
** getParent():获取父节点
** addElement:添加标签




* elemnt(qname)   
**表示获取标签下面的第一个子标签
**qname:标签的名称
* elements(qname)
**获取标签下面是这个名称的所有的子标签(一层)
**qname:标签名称
*elements()
**获取标签下面的所有的一层子标签




6.使用dom4j查询xml
*解析是从上到下来解析的
*查询所有name元素里面的值
/*
1.创建解析器
2.得到document
3.得到根节点 getRootElenment() 返回Element
4.得到所有的p1标签
*element("p1") 返回list集合
*遍历list得到每一个p1
5.得到name
*在p1下面执行 element("name")方法 返回Element
6.得到name里面的值
*getText()得到里面的值
*/


*查询第一个name元素的值
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点

* 4.得到第一个p1元素
**element("p1")方法 返回Element
* 5.得到p1下面的name
**element("name")方法 返回Element
* 6.得到name里面的值
**getText()方法
*/


*获取第二个name元素的值
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点

* 4.得到第二个p1
**返回list集合
* 5.得到p1下面的name
**使用list下标得到get方法,集合的下标从0开始,想要得到第二个值,下标写1
* 6.得到name里面的值
**getText方法
*/


7.使用dom4j实现添加操作
*在第一个p1标签末尾添加一个元素 <sex>nan</sex>
*步骤:
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点

* 4.获取到第一个p1
*使用element方法
* 5.在p1下面添加元素
*在p1上面直接使用addElement("标签名称")方法 返回一个Element
* 6.在添加完成之后的元素下面添加文本
在sex上直接使用 setText("文本内容");方法

* 7.回写xml
*格式化 OutputFormat,使用 createPrettyPrint方法,表示一个漂亮的格式
*使用类XMLWriter 直接new这个类,传递这个两个参数
***第一个参数是xml文件路径 new FileOutputStream("路径");
***第二个参数是格式化类的值
*/
8.使用dom4j在特定的位置添加一个元素
*在第一个p1下面的age标签之前添加一个 <school>JJU</school>
*步骤
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点

* 4.获得到第一个p1

* 5.获取p1下面的所有的元素
* **elements()方法 返回 list集合
* **使用list里面的方法,在list里面添加元素
* **创建元素,在元素下面创建文本
-使用createElement(QName qname);创建标签
-把文本添加到标签下面,使用 setText("文本内容")方法


* ***add(int index, E element)
* -第一个参数是位置下标,从0开始
* -第二个参数是要添加的元素

* 6.回写xml
*/


**可以对得到document的操作和回写xml的操作,封装成方法
**也可以吧传递的文件路径,封装成一个常量
***好处:可以提高开发速度,可以提高代码的可维护性
-比如想要修改文件路径(名称),这个时候只需要修改常量的值就可以了,其他代码不需要改变


9.使用dom4j实现修改节点的操作
*修改第一个p1下面的age元素的值 <age>30</age>
*步骤
/*
* 1.得到document
* 2.得到根节点,然后第一个p1元素.
* 3.得到p1下面的age
element("")方法
* 4.修改值是30
*使用setText("文本内容")方法

* 5.回写xml
*/


10.使用dom4j来实现删除节点的操作
*删除第一个p1下面的<school>JJU</school>元素
*步骤
/*
* 1.得到document
* 2.得到根节点
* 3.得到第一个p1标签
* 4.得到第一个p1下面的school元素
* 5.删除(使用p1删除school)
*得到school的父节点
-第一种直接得到p1
-使用方法 getParent方法得到
*删除操作
-在p1上面执行remove方法删除节点

* 6.回写xml
*/


11.使用dom4j获取属性的需求
*获取第一个p1里面的属性id的值
*步骤
/*
* 1.得到document
* 2.得到根节点
* 3.得到第一个p1元素
* 4.得到p1里面的属性值
-p1.attributeValue("id");
-在p1上面执行这个方法,里面的参数是属性名称
*/


12.使用dom4j支持xpath的操作
*可以直接获取到某个元素


*第一种形式
/AAA/DDD/BBB:表示一层一层的,AAA下面的 DDD下面的BBB
*第二种形式
//BBB:表示和这个名称相同,表示只要名称是BBB,都得到
*第三种形式
/*:所有元素
*第四种形式
** BBB[1]:表示第一个BBB元素
** BBB[last()]:表示最后一个BBB元素
*第五种形式
** //BBB[@id]:表示只要BBB元素上面有id属性,都得到
*第六种形式
** //BBB[@id='b1']:表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是b1




13.使用dom4j支持xpath具体操作
**默认的情况下,dom4j不支持xpath
**如果想要在dom4j里面是有xpath
*第一步需要,引入支持xpath的jar包,使用jaxen-xxxx.jar
**需要把jar包导入到项目中
**在dom4j里面提供了两个方法,用来支持xpath
*** selectNodes("xpath的表达式")
-获取多个节点
***selectSingleNode("xpath表达式")
-获取一个节点


**使用xpath实现:查询xml中所有的name元素的值
**所有name元素的xpath表示:  //name
**使用selectNodes("//name");
**代码和步骤
public static void test1(){
/*
* 1.得到document
* 2.直接使用selectNodes("//name")方法的到所有的name元素

*/

//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//直接使用selectNodes("//name")方法的到所有的name元素
List<Node> list = document.selectNodes("//name");

//遍历list集合
for(Node node : list){
//node是每一个name元素
//得到name元素里面的值
String name = node.getText();

System.out.println(name);

}
}


**使用xpath实现:获取第一个p1下面的name的值
* //p1[@id='aaa']/name
*使用到selectSingleNode("//p1[@id='aaa']/name")
*步骤和代码
public static void test2() {
/*
* 1.得到document
* 2.直接使用selectSingleNode方法实现
* - xpath://p1[@id='aaa']/name
*/

//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//直接使用selectSingleNode方法实现
Node name = document.selectSingleNode("//p1[@id='aaa']/name");

//获取name元素下面的值
String nameStr = name.getText();

System.out.println(nameStr);

}




14.实现简单的学生管理系统
**使用xml当做一个数据库,存储学生信息


**创建一个xml文件,写一些学生信息


**增加操作
//增加
public static void addStu(Student student){
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
* 4.在根节点上面添加stu标签
* 5.在stu标签上面依次添加id,name,age
* 6.在id,name,age上面依次添加值
** setText()操作

* 7.回写xml
*/

//直接通过工具类获取document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//得到根节点
Element root = document.getRootElement();

//在根节点上添加stu
Element stu = root.addElement("stu");

//在根节点上添加id,name,age标签
Element id = stu.addElement("id");
Element name = stu.addElement("name");
Element age = stu.addElement("age");

//在各个属性标签上添加对应的值
id.setText(student.getId());
name.setText(student.getName());
age.setText(student.getAge());


//回写xml
Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);

//提示消息
System.out.println("成功添加"+student.toString()+"的信息");


}

**删除操作(根据id删除)
//删除
public static void delStu(String id){
/*
* 1.通过Dom4jUtil工具类直接获取document
* 2.得到根节点

* 3.获取到所有的id
* 使用xpath  //id 返回list集合
* 4.遍历list集合
* 5.判断集合里面的id和传递的id是否相同
* 6.如果相同,就把id所在的stu删除(删除父节点,同时该结点下的结点都会被删除)

* 7.回写xml
*/

//获取document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//获取所有的id
List<Node> list = document.selectNodes("//id");

//遍历list集合
for(Node id2 : list){
//判断id的值是否和方法中传过来的id相同
if (id2.getText().equals(id)) {//相同
//获取id2的父节点 stu
Element stu = id2.getParent();
//获取stu的父节点
Element student = stu.getParent();

//删除stu
student.remove(stu);
}
}

//回写xml
Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);

System.out.println("成功删除 "+id+" 学生的信息。");
}


**查询操作
//查询
//根据id来查询学生信息
public static Student selectStu(String id) {
/*
* 1.根据Dom4jUtil工具直接获取document
* 2.获取到所有的id标签
* 3.返回的list集合,遍历集合
* 4.得到每一个id节点,
* 5.获取每一个id节点的值
* 6.判断id的值,和传递过来的id值是否相同
* 7.如果相同,则获得id的父节点stu
* 8.获得stu中的name,age节点中的值


**把这些值封装到一个对象中,返回对象
*/

//获取document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//获取到所有的id标签
List<Node> list = document.selectNodes("//id");

//定义nameStr,ageStr
String nameStr = "";
String ageStr = "";

//遍历
for(Node id2 : list){
//获得id节点上的值
String idStr = id2.getText();
if (idStr.equals(id)) {//相同
//获取该节点的父节点stu
Element stu = id2.getParent();

//获取结点stu的name节点上的nameStr
nameStr = stu.element("name").getText();

//获取结点stu的age节点上的ageStr
ageStr = stu.element("age").getText();

System.out.println("查询到一个学生信息:");
}
}

Student student = new Student(id, nameStr, ageStr);

return student;
}
posted @ 2018-04-02 22:21  CHANGEMAX  阅读(113)  评论(0编辑  收藏  举报