【jsoup】html解析
Java HTML Parser
字符串解析为xml文档,作用输入是什么样子的片断,输出业务什么样子的
Document doc = Jsoup.parse(html, "", Parser.xmlParser()); System.out.println(doc.html());
片断<div>hello</div>
Document doc = Jsoup.parse(html, "", Parser.xmlParser());结果 <div> hello </div> Document doc = Jsoup.parse(html);结果 <html> <head></head> <body> <div> hello </div> </body> </html>
字符串解析为文档
String html = "<html><head><title>First html parse</title></head><body><p>Parsed HTML into a doc.</p></body></html>"; Document doc = Jsoup.parse(html); System.out.println(doc.html());
字符串解析为片断
String html = "<div><p>Lorem ipsum.</p>"; Document doc = Jsoup.parseBodyFragment(html); Element body = doc.body(); System.out.println(body.html());
从url加载文档
Document doc = Jsoup.connect("http://www.lianhu.gov.cn/").get(); String title = doc.title(); System.out.println(title); 构建特殊请求 Document doc = Jsoup.connect("http://www.lianhu.gov.cn/") .data("query", "Java") .userAgent("Mozilla") .cookie("auth", "token") .timeout(3000) .post();
从文件加载文档
File input = new File("D:/deya/vhost/zizhou/index.html"); Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/"); System.out.println(doc.html());
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南