JavaWeb学习之XML
模拟servlet执行
浏览器的入口不同(访问路径),访问的资源也就不同,如下:
为了灵活的实现不同路径(/hello)执行不同的资源( HeIIoMyServlet)我们需要使用XML进行配置;
为了限定XML内容,我们需要使用xml约束(DTD或schema);为了获得xml内容,我们需要使用dam4j进行解析
XML
XML称为Extensible Markup Language,意思是可扩展的标记语言。XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。
XML语法
XML文档声明
1.文档声明必须为<?xml开头,以?>结束;
2.文档声明必须从文档的0行0列位置开始:
3.文档声明只有属性:
a) versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;
b) encoding:指定当前文档的编码。可选属性,默认值是。utf-8:
元素element
1.元素是XML文档中最重要的组成部分,
2.普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>
3.元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a ></b>
4.空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭介,例如:<c/>
5.元素命名:
a) 区分大小写
b) 不能使用空格,不能使用冒号:
c) 不建议以XML, xml, Xml开头
6.格式化良好的XML文档,必须只有一个根元素。
属性
1.属性是元素的一部分,它必须出现在元素的开始标签中
2.属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引
3.一个元素可以有0 ~ N个属性,但一个元素中不能出现同名属性
4.属性名不能使用空格、冒号等特殊字符,且必须以字母开头
注释
XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!
转义字符
XML中的转义字符与HTML一样。
因为很多符号己经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:"<"、”>”、” ’ ”、” ” ”、”&”。
CDATA区
当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。
在CDATA段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。
在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。
1 2 3 4 5 6 7 8 9 10 11 12 13 | <?xml version= "1.0" encoding= "UTF-8" ?> <person> <student> <![CDATA[ if (a<b&&b<c){ sum=sum+a; } ]]> </student> <student> </student> </person> |
DTD约束
DTD (Document Type Definition ),文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等
开发中,通常情况我们都是通过框架提供的DTD约束文档,编写对应的XML文档。常见框架使用DTD约束有:struts2, hibernate等。
通过提供的DTD"web-app_2_3.dtd "编写XML
<?xml version="1.0" encoding="UTF-8"?> <!-- 模拟servlet2.3规范,如果开发人员需要在xml使用当前DTD约束,必须包括DOCTYPE。 格式如下: <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd"> --> <!ELEMENT web-app (servlet*,servlet-mapping* , welcome-file-list?) > <!ELEMENT servlet (servlet-name,description?,(servlet-class|jsp-file))> <!ELEMENT servlet-mapping (servlet-name,url-pattern+) > <!ELEMENT servlet-name (#PCDATA)> <!ELEMENT servlet-class (#PCDATA)> <!ELEMENT url-pattern (#PCDATA)> <!ELEMENT description (#PCDATA)> <!ELEMENT jsp-file (#PCDATA)>
<!ELEMENT welcome-file-list (welcome-file+)> <!ELEMENT welcome-file (#PCDATA)>
<!ATTLIST web-app version CDATA #IMPLIED> |
案例实现步骤
1、创建web.xml文档,并将“web-app_ 2_ 3.dtd"拷贝相同目录下。
2、从DTD文档开始处,拷贝需要的“文档声明”
3、完成XML内容的编写
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | <?xml version= "1.0" encoding= "UTF-8" ?> <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd" > <web-app> <servlet> <servlet-name>MyServlet</servlet-name> <servlet- class >com.oracle.demo02.MyServlet</servlet- class > </servlet> <servlet-mapping> <servlet-name>MyServlet</servlet-name> <url-pattern>/myservlet</url-pattern> </servlet-mapping> <welcome-file-list> <welcome-file>index.jsp</welcome-file> <welcome-file>index.html</welcome-file> </welcome-file-list> </web-app> |
DTD语法
文档声明
内部DTD,在XML文档内部嵌入DTD,只对当前的XML有效
<?xml version="1.0" encoding="UTF-8"? standalone="yes" ?> <!DOCTYPE web-app [ ...//具体语法 ]> <web-app> </web-app> |
外部DTD——本地DTD,DTD文档在本地系统上,公司内部自己项目使用。
外部DTD——公共DTD,DTD文档在网络上,一般都有框架提供
元素声明
定义元素语法:<!ELEMENT元素名 元素描述> 元素名:自定义 元素描述包括 : 符号和数据类型 常见符号: ? * + () | , 常见类型:#PCDATA表示内容是文本,不能是子标签
|
符号 |
符号类型
|
描述 |
示例
|
? |
问号 |
表示该对象可以出现,但只能出现一次 |
(菜鸟?)
|
* |
星号
|
表示该对象允许出现任意多次,也可以是零次 |
(爱好*)
|
+ |
加号
|
表示该对象最少出现一次,可以出现多次 |
(成员+)
|
() |
括号
|
用来给元素分组 |
(古龙|金庸|梁羽生), (王朔|余杰),毛毛
|
| |
竖条
|
表明在列出的对象中选择一个
|
(男人|女人)
|
, |
逗号 |
表示对象必须按指定的顺序出现 |
(西瓜,苹果,香蕉)
|
例如:
<!ELEMENT web-app(servlet*,servlet-mapping*welcome-file-list?)> web-app包括3个标签,且必须顺序出现。 servlet子标签个数任意 servlet-mapping子标签个数任意 welcome-file-list子标签最多只能出现一次 <!ELEMENT servlet(servlet-name,description?,(servlet-class|jsp-file))> servlet有3个子标签,且必须顺序出现 servlet-name,必须有,且只能出现1次 description,可选1次 servlet-class和jsp-file二选一,且只能出现一次 <!ELEMENT servlet-name(#PCDATA)> servlet-name的标签体必须是文本 <!ELEMENT welcome-file-list (welcome-file+)> welcome-file-list至少有1个子标签welcome-file
|
属性声明
Schema约束
Schema是新的XML文档约束:
Schema要比DTD强大很多,是DTD替代者;
Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml .
Schema功能更强大,数据类型更完善
Schema支持名称空间
与DTD一样,要求可以通过schema约束文档编写xml文档。常见框架使用schema的有:Spring等通过提供”web-app_ 2_ 5.xsd"编写xml文档
<?xml version="1.0" encoding="UTF-8"?> <!-- 模拟servlet2.5规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。 格式如下: <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> --> <xsd:schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.example.org/web-app_2_5" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:tns="http://www.example.org/web-app_2_5" elementFormDefault="qualified">
<xsd:element name="web-app"> <xsd:complexType> <xsd:choice minOccurs="0" maxOccurs="unbounded"> <xsd:element name="servlet"> <xsd:complexType> <xsd:sequence> <xsd:element name="servlet-name"></xsd:element> <xsd:element name="servlet-class"></xsd:element> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="servlet-mapping"> <xsd:complexType> <xsd:sequence> <xsd:element name="servlet-name"></xsd:element> <xsd:element name="url-pattern" maxOccurs="unbounded"></xsd:element> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="welcome-file-list"> <xsd:complexType> <xsd:sequence> <xsd:element name="welcome-file" maxOccurs="unbounded"></xsd:element> </xsd:sequence> </xsd:complexType> </xsd:element> </xsd:choice> <xsd:attribute name="version" type="double" use="optional"></xsd:attribute> </xsd:complexType> </xsd:element> </xsd:schema> |
案例文档中同一个“命名空间”分别使用“默认命名空间”和“显示命名空间”进行引入,所以文档中<schema>和<xsd:schema>作用一样。
案例实现步骤
1、创建web.xml,并将"web-app_2_5.xsd"拷贝到同级目录
2、从xsd文档中拷贝需要的“命名空间” 也就是对文档及进行声明
3、完成对XML内容的编写
<?xml version="1.0" encoding="UTF-8"?> <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> <servlet> <servlet-name></servlet-name> <servlet-class></servlet-class> </servlet> <servlet-mapping> <servlet-name></servlet-name> <url-pattern></url-pattern> </servlet-mapping> <welcome-file-list> <welcome-file></welcome-file> <welcome-file></welcome-file> </welcome-file-list> </web-app> |
命名空间
名称空间就是用来处理元素和属性的名称冲突问题,与Java中的包是同一用途。如果每个元素和属性都有自己的名称空间,那么就不会出现名字冲突问题,就像是每个类都有自己所在的包一样,那么类名就不会出现冲突。
约束文档和XML的关系
当W3C提出Schema约束规范时,就提供“官方约束文档”。我们通过官方文档,必须“自定义schema约束文档”,开发中“自定义文档”由框架编写者提供。我们根据“自定义文档”限定,写出自己的xml文档。
声明命名空间
实例:web-a pp_2_5.xsd
实例:web.xml
dom4j解析
解析方式和解析器
1、DOM解析:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。
a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b)缺点:XML文档过大,可能出现内存溢出显现。
2、SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件 驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)
a) 优点:处理速度快,可以处理大文件
b) 缺点:只能读,逐行后将释放资源。
3、PULL: Android内置的XML解析方式,类似SAX。(了解)
解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
常见的解析开发包:
1、 JAXP: sun公司提供支持DOM和SAX开发包
2、JDom:dom4j兄弟
3、jsoup:一种处理HTML特定解析开发包
4、dom4j:比较常用的解析开发包,hibernate底层采用。
DOM解析原理以及结构模型
XML DOM和HTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个DOM树,
并获得一个Document对象,通过Document对象就可以对DOM进行操作
DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点!
API使用
如果需要使用dom4j,必须导入jar包。
dom4j必须使用核心类SaxReader加载xml文档获得Document通过Document对象获得文档的根元素,然后就可以操作了。
步骤:
1.获取解析器
2.获得document文档对象
3.获取根元素
4.获取根元素下的子元素
5.遍历子元素
6.判断元素名称为servlet的元素
7.获取servlet-name元素
8.获取servlet-class元素
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 | package com.oracle.demo04; import java.util.List; import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.Element; import org.dom4j.io.SAXReader; public class Test { public static void main(String[] args) throws DocumentException { // 1.获取解析器 SAXReader saxReader = new SAXReader(); // 2.获得document文档对象 Document doc = saxReader.read( "src/com/oracle/demo04/web.xml" ); // 3.获取根元素 Element rootElement = doc.getRootElement(); // System.out.println(rootElement.getName()); // 4.获取根元素下的子元素 List<Element> arr = rootElement.elements(); // 5.遍历子元素 for (Element e : arr) { // System.out.println(e.getName()); // 6.判断元素名称为servlet的元素 if ( "servlet" .equals(e.getName())) { // 7.获取servlet-name元素 Element servletname = e.element( "servlet-name" ); String sn = servletname.getText(); System.out.println(sn); // 8.获取servlet-class元素 Element servletclass = e.element( "servlet-class" ); String sc = servletclass.getText(); System.out.println(sc); } } } } |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | <?xml version= "1.0" encoding= "UTF-8" ?> <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd" > <web-app> <servlet> <servlet-name>MyServlet</servlet-name> <servlet- class >com.oracle.demo02.MyServlet</servlet- class > </servlet> <servlet-mapping> <servlet-name>MyServlet</servlet-name> <url-pattern>/myservlet</url-pattern> </servlet-mapping> <welcome-file-list> <welcome-file>index.jsp</welcome-file> <welcome-file>index.html</welcome-file> </welcome-file-list> </web-app> |
通过反射解析XML文件中的内容,可以避免将代码写死
例如:
1 2 3 4 5 6 7 8 9 10 11 12 13 | <?xml version= "1.0" encoding= "UTF-8" ?> <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd" > <web-app> <servlet> <servlet-name>MyServletImp</servlet-name> <servlet- class >com.oracle.demo05.MyServletImp</servlet- class > </servlet> <servlet-mapping> <servlet-name>MyServletImp</servlet-name> <url-pattern>/myservlet</url-pattern> </servlet-mapping> </web-app> |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 | package com.oracle.demo05; public interface MyServlet { public void init(); public void service(); public void destory(); } package com.oracle.demo05; public class MyServletImp implements MyServlet { @Override public void init() { System.out.println( "初始化" ); } @Override public void service() { System.out.println( "服务" ); } @Override public void destory() { System.out.println( "销毁" ); } } package com.oracle.demo05; import java.lang.reflect.Method; import org.dom4j.Document; import org.dom4j.Element; import org.dom4j.io.SAXReader; public class MyServletImpDemo { public static void main(String[] args) throws Exception { // 1.创建解析器对象 SAXReader saxReader = new SAXReader(); // 2.使用解析器加载web.xml文件得到document对象 Document doc = saxReader.read( "src/com/oracle/demo05/web.xml" ); // 3.获取根元素节点 Element root = doc.getRootElement(); // 4.根据元素名称获取子元素节点 Element servletName = root.element( "servlet" ); // 5.根据元素名称获取servlet-class的文本节点 Element servletclass = servletName.element( "servlet-class" ); String name = servletclass.getText(); // 6.通过类全名获取字节码文件 Class c = Class.forName(name); // 7.创建实例对象 // MyServletImp m = (MyServletImp) c.newInstance(); Object obj = c.newInstance(); // 8.调用实例对象里面的方法 // m.init(); // m.service(); // m.destory(); Method init = c.getMethod( "init" ); init.invoke(obj); Method service = c.getMethod( "service" ); service.invoke(obj); Method destory = c.getMethod( "destory" ); destory.invoke(obj); } } |
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 理解Rust引用及其生命周期标识(下)
· 从二进制到误差:逐行拆解C语言浮点运算中的4008175468544之谜
· .NET制作智能桌面机器人:结合BotSharp智能体框架开发语音交互
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列:向量数据库的应用与畅想
· 2025成都.NET开发者Connect圆满结束
· 在 VS Code 中,一键安装 MCP Server!
· 后端思维之高并发处理方案
· langchain0.3教程:从0到1打造一个智能聊天机器人
· 千万级大表的优化技巧