xml_Jsoup快速入门和xml_Jsoup对象
xml_Jsoup快速入门
步骤:
1.导入jar包
2.获取Document对象
3.获取对应的标签Element对象
4.获取数据
找到jar包进行引入:
或:工程项目的pom.xml文件引入
或:直接写main方法写Jsoup提示出来回车就自动添加了
快速入门代码:
public class Jsoup_1 { public static void main(String[] args) throws IOException { //获取Document对象,根据xml文档获取 //获取student.xml的path String path = Jsoup_1.class.getClassLoader().getResource("student.xml").getPath(); //解析xml文档,加载文档进内存,获取dom树-->Document Document document = Jsoup.parse(new File(path), "utf-8"); //获取元素对象 Element Elements elements = document.getElementsByTag("name"); System.out.println(elements.size()); //获取第一个name的Element对象 Element element = elements.get(0); //获取数据 String name = element.text(); System.out.println(name); } }
xml_Jsoup对象
Jsoup:工具类,可以解析html或xml文档,返回Document
parse:解析html或xml文档,返回Document
parse(File in,String charsetName):解析xml或html文件的。
parse(String html):解析xml或html字符串
parse(URL url,int timeoutMillis):通过网络路径获取指定的html或xml的文档对象
public static void main(String[] args) throws IOException { //获取student.xml的path String path = Jsoup_2.class.getClassLoader().getResource("student.xml").getPath(); //解析xml文档,加载文档进内存,获取dom树-->Document /*Document document = Jsoup.parse(new File(path), "utf-8"); System.out.println(document);*/ //2.parse(String html):解析xml或html字符串 /*String str = "<?xml version=\"1.0\" encoding=\"UTF-8\" ?>\n" + "\n" + " <students>\n" + "\t<student number=\"sq_0001\">\n" + "\t\t<name>张三</name>\n" + "\t\t<age>11</age>\n" + "\t\t<sex>male</sex>\n" + "\t</student>\n" + "\t<student number=\"sq_0002\">\n" + "\t\t<name>李四</name>\n" + "\t\t<age>12</age>\n" + "\t\t<sex>female</sex>\n" + "\t</student>\n" + " </students>"; Document document = Jsoup.parse(str); System.out.println(document);*/ //3.parse(URL url,int timeoutMillis):通过网络路径获取指定的html或xml的文档对象 URL url = new URL("https://baike.baidu.com/item/jsoup/9012509?fr=aladdin");//代表网络中的资源路径 Document document = Jsoup.parse(url, 10000); System.out.println(document); }