Java爬虫入门二
总体步骤:
-
创建HttpClient对象
-
输入网址
-
发起请求
-
解析响应
-
带参数的GET请求
上代码
import org.apache.http.HttpEntity;
import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.client.utils.URIBuilder;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import java.io.IOException;
import java.net.URISyntaxException;
/**
* 带参数的get请求爬虫
*/
public class SpyderGetParamTest {
public static void main(String[] args) throws URISyntaxException {
// 创建HttpClient对象
HttpClient httpClient = HttpClients.createDefault();
// 输入网址
String url = "https://www.baidu.com/serach";
// 创建uri对象
URIBuilder uriBuilder = new URIBuilder(url);
// 设置参数
uriBuilder.setParameter("keys","java");
HttpGet httpGet = new HttpGet(uriBuilder.build());
// 发起请求
HttpResponse response = null;
try {
response = httpClient.execute(httpGet);
// 解析响应
if (response.getStatusLine().getStatusCode() == 200) {
HttpEntity entity = response.getEntity();
String content = EntityUtils.toString(entity, "utf8");
System.out.println(content);
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
· 字符编码:从基础到乱码解决
· 提示词工程——AI应用必不可少的技术