java 如何解决爬虫ip被封的3种方式

1.设置代理ip

1 HttpHost proxy = new HttpHost("112.36.34.134",80);//设置代理ip
2 
3         RequestConfig config = RequestConfig.custom()
4                 .setProxy(proxy)
5             

2.延长访问时间

1         RequestConfig config = RequestConfig.custom()
2                 
3                 .setConnectTimeout(1000=0)// 创建连接的最长时间
4                 .setConnectionRequestTimeout(1000)// 获取连接的最长时间
5                 .setSocketTimeout(1000)// 数据传输的最长时间
6                 .build();

3.伪装成浏览器

1 HttpGet httpGet = new HttpGet(url);
2         // 设置请求信息
3         //伪装浏览器
4         httpGet.setHeader("User-Agent","Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:58.0) Gecko/20100101 Firefox/58.0");
posted @   乖怪丶  阅读(1120)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
欢迎这位客官来到《java 如何解决爬虫ip被封的3种方式 - 乖怪丶 - 博客园》
点击右上角即可分享
微信分享提示