XML技术
1|0XML
1|1概念
可扩展标记语言
1|2用途
配置文件
使用框架时需要写配置文件
传输数据
在网络中传输数据时并不能传输JAVA对象,所以我们需要将JAVA对象转成字符串传输,其中一种方式就是将对象转为 XML 类型的字符串
1|3xml和html区别
xml语法严格,html语法松散
xml标签自定义,html标签预定义
1|4XML基本语法
1|5XML组成部分
文档声明
#### 属性列表 version:版本号(必须) encoding:编码方式 ### 标签 XML中标签是自定义的,标签名要求 - 包含数字,字幕,其他字符 - 不呢个以数字和标点符号开头 - 不能包含空格 ### 指令 指令是结合 css 使用的,但现在XML 一般不结合 CSS,语法为: ```xmlSchema约束
引入
约束图解
1|6XML解析
XML解析即读写XML文档中的数据。框架的开发者通过 XML解析读取框架使用者配的参数信息,开发者也可以通过 XML解析读取网络传来的数据
XML解析思想
DOM
将标记语言文档一次性加载进内存,在内存中形成一棵dom树
优点:操作方便,可以对文档进行CRUD的所有操作
缺点:占内存
SAX
逐行读取,基于事件驱动的。
优点:不占内存,一般用于手机APP开发中读取XML
缺点 :只能读取,不能增删改
常见解析器
JAXP
SUN公司提供的解析器 ,支持DOM和SAX两种思想
DOM4J
主要支持 DOM
Jsoup
是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的API,可通过 DOM,CSS 以及类似于jQuery 的操作方法来取出和操作数据
PULL
Android操作系统内置的解析器,支持SAX思想
Jsoup使用步骤
导入jar包
常用对象
Jsoup
解析xml或html,形成dom树对象
常用方法:
Document:xml的dom树对象
Element: 元素对象
常用方法
XPath解析
使用 Jsoup 完成网页爬虫
网络爬虫 (web crawler) : 自动抓取互联网信息的程序。
Jsoup 可以通过 URL 获取网页的 HTML 源文件,源文件中包含着网站数据,我们可以解 HTML 源文件的数据来获取我们需要的信息
使用XML配置爬虫程序的参数
爬虫程序有一些参数需要配置,如果直接将参数写在JAVA 程序中,则修改参数非常不方便,所以此时我们将参数写在 XML配置文件中,通过解析 XML文件获取参数的配置信息
__EOF__
作 者:YXH
出 处:https://www.cnblogs.com/YxinHaaa/p/17397749.html
关于博主:编程路上的小学生,热爱技术,喜欢专研。评论和私信会在第一时间回复。或者直接私信我。
版权声明:署名 - 非商业性使用 - 禁止演绎,协议普通文本 | 协议法律文本。
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· DeepSeek 开源周回顾「GitHub 热点速览」
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了