XML小知识

XML小知识

一、基础知识

1、简介
Extensible Markup Language 可扩展标记语言

2、文档声明
(1)xml第一行必须定义为文档声明
(2)格式:<?xml 属性列表 ?>

version:版本号
encoding:编码方式
standalone:是否独立

3、CDATA区
(1)格式: <![CDATA[ 数据 ]]>
(2)CDATA区:在该区域中的数据会被原样展示

二、XML约束

1、DTD约束
引入

本地:<!DOCTYPE 根标签名 SYSTEM "dtd文件的位置"
网络:<!DOCTYPE 根标签名 PUBLIC "dtd文件名字" "dtd文件的位置URL">

2、Schema约束
引入

  • 引入xsi前缀
  • 引入xsd文件命名空间
  • 为每一个xsd约束声明一个前缀,作为标识

三、解析器

1、Jsoup
(1)简介

  • java 的HTML解析器
  • 可直接解析某个URL地址、HTML文本内容

(2)代码

		//获取xxx.xml的path
        String path = JsoupDemo1.class.getClassLoader().getResource("xxx.xml").getPath();
        //解析xml文档,加载文档进内存,获取dom树--->Document
        Document document = Jsoup.parse(new File(path), "utf-8");
        //获取元素对象 Element
        Elements elements = document.getElementsByTag("name");

        System.out.println(elements.size());
        //获取第一个name的Element对象
        Element element = elements.get(0);
        //获取数据
        String name = element.text();
        System.out.println(name);

(3)常用方法

parse​(File in, String charsetName):解析xml或html文件。
parse​(String html):解析xml或html字符串
parse​(URL url, int timeoutMillis):解析通过网络路径获取指定的html或xml的文档对象
posted @ 2020-03-04 19:51  李泽坤  阅读(84)  评论(0编辑  收藏  举报