Java网络爬虫Hello world实现——Httpclient爬取百度首页
1.创建Maven项目
2.Httpclient Maven地址
1 <dependency> 2 <groupId>org.apache.httpcomponents</groupId> 3 <artifactId>httpclient</artifactId> 4 <version>4.5.5</version> 5 </dependency>
在pom.xml文件中添加Httpclient jar包
1 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 2 xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> 3 <modelVersion>4.0.0</modelVersion> 4 <groupId>com.gxy.blogs</groupId> 5 <artifactId>Demo</artifactId> 6 <version>0.0.1-SNAPSHOT</version> 7 8 <dependencies> 9 <dependency> 10 <groupId>org.apache.httpcomponents</groupId> 11 <artifactId>httpclient</artifactId> 12 <version>4.5.5</version> 13 </dependency> 14 </dependencies> 15 16 </project>
3.主要代码
1 package cha01; 2 3 import java.io.IOException; 4 import org.apache.http.HttpEntity; 5 import org.apache.http.client.ClientProtocolException; 6 import org.apache.http.client.methods.CloseableHttpResponse; 7 import org.apache.http.client.methods.HttpGet; 8 import org.apache.http.impl.client.CloseableHttpClient; 9 import org.apache.http.impl.client.HttpClients; 10 import org.apache.http.util.EntityUtils; 11 12 public class Test { 13 14 public static void main(String[] args) throws IOException { 15 CloseableHttpClient httpclient=HttpClients.createDefault(); 16 HttpGet httpget=new HttpGet("http://www.baidu.com"); 17 CloseableHttpResponse response=httpclient.execute(httpget); 18 HttpEntity entity=response.getEntity(); 19 System.out.println(entity); 20 String page=EntityUtils.toString(entity, "utf-8"); 21 System.out.println(page); 22 response.close(); 23 httpclient.close(); 24 } 25 }
4.运行结果
标签:
Java网络爬虫
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?