说明
gradle引用
| |
| |
| compile group: 'net.sourceforge.htmlunit', name: 'htmlunit', version: '2.44.0' |
| |
| |
| compile group: 'org.jsoup', name: 'jsoup', version: '1.13.1' |
案例
| import com.gargoylesoftware.htmlunit.BrowserVersion |
| import com.gargoylesoftware.htmlunit.WebClient |
| import com.gargoylesoftware.htmlunit.html.DomElement |
| import com.gargoylesoftware.htmlunit.html.HtmlPage |
| |
| |
| WebClient webClient = new WebClient(BrowserVersion.FIREFOX_68) |
| |
| webClient.getOptions().setJavaScriptEnabled(true) |
| |
| webClient.getOptions().setCssEnabled(false) |
| |
| webClient.getOptions().setThrowExceptionOnScriptError(false) |
| webClient.getOptions().setThrowExceptionOnFailingStatusCode(false) |
| |
| webClient.getOptions().setTimeout(10 * 1000) |
| |
| HtmlPage htmlPage = webClient.getPage("https://news.sina.com.cn/roll/") |
| |
| webClient.waitForBackgroundJavaScript(10 * 1000) |
| |
| String text = htmlPage.asText() |
| |
| String html = htmlPage.asXml() |
| |
| DomElement spanDom = htmlPage.getElementByName("span") |
| |
| spanDom.getTextContent() |
| |
| spanDom.click() |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?