xml_解析_Jsoup_快速入门与xml_解析_Jsoup_Jsoup对象

xml_解析_Jsoup_快速入门

　　　　 Jsoup：jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。
　　　　　　　　　　快速入门：
　　　　　　　　　　　　　步骤：
　　　　　　　　　　　　　　　　　　1. 导入jar包
　　　　　　　　　　　　　　　　　　2. 获取Document对象
　　　　　　　　　　　　　　　　　　3. 获取对应的标签Element对象
　　　　　　　　　　　　　　　　　　4. 获取数据

package cn.itcast.xml.jsoup;


import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.IOException;

/**
 * Jsoup快速入门
 */
public class JsoupDemo1 {
    public static void main(String[] args) throws IOException {
        //2.获取Document对象，根据xml文档获取
        //2.1获取student.xml的path
        String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
        //2.2解析xml文档，加载文档进内存，获取dom树--->Document
        Document document = Jsoup.parse(new File(path), "utf-8");
        //3.获取元素对象 Element
        Elements elements = document.getElementsByTag("name");

        System.out.println(elements.size());
        //3.1获取第一个name的Element对象
        Element element = elements.get(0);
        //3.2获取数据
        String name = element.text();
        System.out.println(name);
    }

}

xml_解析_Jsoup_Jsoup对象对象的使用：

　　　　1. Jsoup：工具类，可以解析html或xml文档，返回Document
　　　　　　　　　　　 parse：解析html或xml文档，返回Document
　　　　　　　　　　　parse(File in, String charsetName)：解析xml或html文件的。
　　　　　　　　　　　parse(String html)：解析xml或html字符串
　　　　　　　　　　　parse(URL url, int timeoutMillis)：通过网络路径获取指定的html或xml的文档对象
　　　　2. Document：文档对象。代表内存中的dom树
　　　　3. Elements：元素Element对象的集合。可以当做 ArrayList<Element>来使用
　　　　4. Element：元素对象
　　　　5. Node：节点对象

package cn.itcast.xml.jsoup;


import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.IOException;
import java.net.URL;

/**
 * Jsoup对象功能
 */
public class JsoupDemo2 {
    public static void main(String[] args) throws IOException {
        //2.1获取student.xml的path
        String path = JsoupDemo2.class.getClassLoader().getResource("student.xml").getPath();
        //2.2解析xml文档，加载文档进内存，获取dom树--->Document
       /* Document document = Jsoup.parse(new File(path), "utf-8");
        System.out.println(document);*/

       //2.parse(String html)：解析xml或html字符串
       /* String str = "<?xml version=\"1.0\" encoding=\"UTF-8\" ?>\n" +
                "\n" +
                "<students>\n" +
                "\t<student number=\"heima_0001\">\n" +
                "\t\t<name>tom</name>\n" +
                "\t\t<age>18</age>\n" +
                "\t\t<sex>male</sex>\n" +
                "\t</student>\n" +
                "\t<student number=\"heima_0002\">\n" +
                "\t\t<name>jack</name>\n" +
                "\t\t<age>18</age>\n" +
                "\t\t<sex>female</sex>\n" +
                "\t</student>\n" +
                "\n" +
                "</students>";
        Document document = Jsoup.parse(str);
        System.out.println(document);*/

       //3.parse(URL url, int timeoutMillis)：通过网络路径获取指定的html或xml的文档对象
        URL url = new URL("https://baike.baidu.com/item/jsoup/9012509?fr=aladdin");//代表网络中的一个资源路径
        Document document = Jsoup.parse(url, 10000);
        System.out.println(document);

    }

}

posted @ 2022-12-01 18:05 zj勇敢飞，xx永相随阅读(48) 评论(0) 收藏举报

刷新页面返回顶部

生产队的大驴and小乌贼来了

xml_解析_Jsoup_快速入门与xml_解析_Jsoup_Jsoup对象