xml_Jsoup快速入门和xml_Jsoup对象

xml_Jsoup快速入门

步骤:

  1.导入jar包

  2.获取Document对象

  3.获取对应的标签Element对象

  4.获取数据

找到jar包进行引入:

 

 或:工程项目的pom.xml文件引入

 

 或:直接写main方法写Jsoup提示出来回车就自动添加了

 

 

 快速入门代码:

public class Jsoup_1 {
    public static void main(String[] args) throws IOException {
        //获取Document对象,根据xml文档获取
        //获取student.xml的path
        String path = Jsoup_1.class.getClassLoader().getResource("student.xml").getPath();
        //解析xml文档,加载文档进内存,获取dom树-->Document
        Document document = Jsoup.parse(new File(path), "utf-8");
        //获取元素对象 Element
        Elements elements = document.getElementsByTag("name");
        System.out.println(elements.size());
        //获取第一个name的Element对象
        Element element = elements.get(0);
        //获取数据
        String name = element.text();
        System.out.println(name);

    }
}

xml_Jsoup对象

Jsoup:工具类,可以解析html或xml文档,返回Document

  parse:解析html或xml文档,返回Document

    parse(File in,String charsetName):解析xml或html文件的。

    parse(String html):解析xml或html字符串

    parse(URL url,int timeoutMillis):通过网络路径获取指定的html或xml的文档对象

    public static void main(String[] args) throws IOException {
        //获取student.xml的path
        String path = Jsoup_2.class.getClassLoader().getResource("student.xml").getPath();
        //解析xml文档,加载文档进内存,获取dom树-->Document
        /*Document document = Jsoup.parse(new File(path), "utf-8");
        System.out.println(document);*/

        //2.parse(String html):解析xml或html字符串
        /*String str = "<?xml version=\"1.0\" encoding=\"UTF-8\" ?>\n" +
                "\n" +
                " <students>\n" +
                "\t<student number=\"sq_0001\">\n" +
                "\t\t<name>张三</name>\n" +
                "\t\t<age>11</age>\n" +
                "\t\t<sex>male</sex>\n" +
                "\t</student>\n" +
                "\t<student number=\"sq_0002\">\n" +
                "\t\t<name>李四</name>\n" +
                "\t\t<age>12</age>\n" +
                "\t\t<sex>female</sex>\n" +
                "\t</student>\n" +
                " </students>";
        Document document = Jsoup.parse(str);
        System.out.println(document);*/

        //3.parse(URL url,int timeoutMillis):通过网络路径获取指定的html或xml的文档对象
        URL url = new URL("https://baike.baidu.com/item/jsoup/9012509?fr=aladdin");//代表网络中的资源路径
        Document document = Jsoup.parse(url, 10000);
        System.out.println(document);
    }

 

 

posted @ 2022-08-06 11:31  魔光领域  阅读(69)  评论(0编辑  收藏  举报