Fork me on GitHub

Java网络爬虫Hello world实现——Httpclient爬取百度首页

1.创建Maven项目

2.Httpclient Maven地址

1 <dependency>
2     <groupId>org.apache.httpcomponents</groupId>
3     <artifactId>httpclient</artifactId>
4     <version>4.5.5</version>
5 </dependency>

在pom.xml文件中添加Httpclient jar包

复制代码
 1 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 2     xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
 3     <modelVersion>4.0.0</modelVersion>
 4     <groupId>com.gxy.blogs</groupId>
 5     <artifactId>Demo</artifactId>
 6     <version>0.0.1-SNAPSHOT</version>
 7 
 8     <dependencies>
 9         <dependency>
10             <groupId>org.apache.httpcomponents</groupId>
11             <artifactId>httpclient</artifactId>
12             <version>4.5.5</version>
13         </dependency>
14     </dependencies>
15 
16 </project>
复制代码

3.主要代码

复制代码
 1 package cha01;
 2 
 3 import java.io.IOException;
 4 import org.apache.http.HttpEntity;
 5 import org.apache.http.client.ClientProtocolException;
 6 import org.apache.http.client.methods.CloseableHttpResponse;
 7 import org.apache.http.client.methods.HttpGet;
 8 import org.apache.http.impl.client.CloseableHttpClient;
 9 import org.apache.http.impl.client.HttpClients;
10 import org.apache.http.util.EntityUtils;
11 
12 public class Test {
13 
14     public static void main(String[] args) throws IOException {
15         CloseableHttpClient httpclient=HttpClients.createDefault();
16         HttpGet httpget=new HttpGet("http://www.baidu.com");
17         CloseableHttpResponse response=httpclient.execute(httpget);
18         HttpEntity entity=response.getEntity();
19         System.out.println(entity);
20         String page=EntityUtils.toString(entity, "utf-8");
21         System.out.println(page);
22         response.close();
23         httpclient.close();
24     }
25 }
复制代码

4.运行结果

 

posted @   Aiden郭祥跃  阅读(1486)  评论(0编辑  收藏  举报
编辑推荐:
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
";
点击右上角即可分享
微信分享提示

目录导航