posts - 397,comments - 0,views - 25332

步骤:

   导入jar包

   获取Document对象

   获取对应的便签Element对象

   获取对应的数据 

<dependency>
            <groupId>org.jsoup</groupId>
            <artifactId>jsoup</artifactId>
            <version>1.10.2</version>
        </dependency>
复制代码
 public static void main(String[] args) throws IOException {

            String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
            Document document = Jsoup.parse(new File(path), "utf-8");
            Elements name = document.getElementsByTag("name");
            System.out.println(name.size());
            Element element = name.get(0);
            String text = element.text();
            System.out.println(text);
    }
复制代码
复制代码
<?xml version="1.0" encoding="UTF-8" ?>
<students>
    <student number="heima_0001">
        <name>zhangsan</name>
        <age>11</age>
        <sex>male</sex>
    </student>
    <student number="heima_0002">
        <name>wangwi</name>
        <age>14</age>
        <sex>female</sex>
    </student>
</students>
复制代码

 

 

 

 

 

 

 

 

 

 

 

 

 xml_解析_jsoup_jsoup对象

Jsoup:工具类可以解析html或xml文档,返回Document

  parse:解析html或xml文档,返回

  parse:(File in,String charsetName)解析xml或html文件

  parse:(String html):解析xml或html字符串

  parse:(URL url,int timeouMillis)通过网络路径获取html或xml的文档对象

Document:文档对象。代表内存中的dom树

Elements:元秦Element对象的集合。可以当做ArrayList<Element>来使用

Element :元秦对象

Node :节点对象

 

复制代码
public static void main(String[] args) throws IOException {

            String path = JsoupDemo2.class.getClassLoader().getResource("student.xml").getPath();
//            Document document = Jsoup.parse(new File(path), "utf-8");
//            System.out.println(document);

            //解析xml和html字符串
            /*String str = "<?xml version=\"1.0\" encoding=\"UTF-8\" ?>\n" +
                    "<students>\n" +
                    "    <student number=\"heima_0001\">\n" +
                    "        <name>zhangsan</name>\n" +
                    "        <age>11</age>\n" +
                    "        <sex>male</sex>\n" +
                    "    </student>\n" +
                    "    <student number=\"heima_0002\">\n" +
                    "        <name>wangwi</name>\n" +
                    "        <age>14</age>\n" +
                    "        <sex>female</sex>\n" +
                    "    </student>\n" +
                    "</students>";
        Document parse = Jsoup.parse(str);
        System.out.println(parse);*/

        //通过网络路径获取制定的html或xml文件当对象
        URL url = new URL("https://baike.baidu.com/item/jsoup/9012509?fr=aladdin");
        Document parse = Jsoup.parse(url, 10000);
        System.out.println(parse);
    }
复制代码

 

posted on   淤泥不染  阅读(37)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示