XML小知识
XML小知识
一、基础知识
1、简介
Extensible Markup Language 可扩展标记语言
2、文档声明
(1)xml第一行必须定义为文档声明
(2)格式:<?xml 属性列表 ?>
version:版本号
encoding:编码方式
standalone:是否独立
3、CDATA区
(1)格式: <![CDATA[ 数据 ]]>
(2)CDATA区:在该区域中的数据会被原样展示
二、XML约束
1、DTD约束
引入
本地:<!DOCTYPE 根标签名 SYSTEM "dtd文件的位置"
网络:<!DOCTYPE 根标签名 PUBLIC "dtd文件名字" "dtd文件的位置URL">
2、Schema约束
引入
- 引入xsi前缀
- 引入xsd文件命名空间
- 为每一个xsd约束声明一个前缀,作为标识
三、解析器
1、Jsoup
(1)简介
- java 的HTML解析器
- 可直接解析某个URL地址、HTML文本内容
(2)代码
//获取xxx.xml的path
String path = JsoupDemo1.class.getClassLoader().getResource("xxx.xml").getPath();
//解析xml文档,加载文档进内存,获取dom树--->Document
Document document = Jsoup.parse(new File(path), "utf-8");
//获取元素对象 Element
Elements elements = document.getElementsByTag("name");
System.out.println(elements.size());
//获取第一个name的Element对象
Element element = elements.get(0);
//获取数据
String name = element.text();
System.out.println(name);
(3)常用方法
parse(File in, String charsetName):解析xml或html文件。
parse(String html):解析xml或html字符串
parse(URL url, int timeoutMillis):解析通过网络路径获取指定的html或xml的文档对象