Jsoup使用方法

1、导入pom

maven仓库:跳转

<dependency>
  <groupId>org.jsoup</groupId>
  <artifactId>jsoup</artifactId>
  <version>1.8.3</version>
</dependency>

2、连接并获取网页节点信息

Document document = Jsoup.parse(new URL(url), 30000);// 连接
//Document document =Jsoup.connect(url).timeout(10*1000).validateTLSCertificates(false).get();//解决ssl证书错误问题

//使用方法直接写作一行,具体使用哪个可根据document决定
Elements item =  document.getElementsByClass("").get(0).getElementById("").getElementsByTag("").attr("href").text();//还有很多,这些是最主要的

//注意当字符串存在空格时,如:
String str="styles StyledRow-sc-1nuqtm0-0 znNOo";  //className存在空格,直接获取是拿不到的
应该:
Elements elements = doc.getElementsByAttributeValue("class", str); //直接根据属性名、属性值获取 

3、建议配合idea的计算器一起使用,舒服一批,不用重复启动,直接在document打断点即可

posted @   Retired-lad  阅读(252)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek “源神”启动!「GitHub 热点速览」
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· DeepSeek R1 简明指南:架构、训练、本地部署及硬件要求
· 2 本地部署DeepSeek模型构建本地知识库+联网搜索详细步骤
点击右上角即可分享
微信分享提示