java抓取网页源码
import java.io.*; import java.net.*; public class test { public static void main(String args[]) { //判断参数是否为两个,正确的用法为 FirstSocket 网站页面 if(args.length!=2) { System.out.println("Usage : FirstSocket host page\r\nExample:FirstSocket www.google.com"); System.exit(0); } //示例:http://www.circul.org/index.php String strServer=args[0]; //取得第一个参数 www.circul.org
String strPage = args[1]; //取得第二个参数 要浏览的页面 /index.php
try { String hostname = strServer; int port = 80; InetAddress addr = InetAddress.getByName(hostname); // System.out.println("myvar "+addr+"\r\n"); Socket socket = new Socket(addr, port); //建立一个Socket //发送命令 BufferedWriter wr = new BufferedWriter(new OutputStreamWriter(socket.getOutputStream(), "UTF8")); wr.write("GET " + strPage + " HTTP/1.0\r\n"); //System.out.println("POST " + strPage + " HTTP/1.0\r\n"); wr.write("HOST:" + strServer + "\r\n"); //System.out.println("HOST:" + strServer + "\r\n"); wr.write("\r\n"); wr.flush(); //接收返回的结果 BufferedReader rd = new BufferedReader(new InputStreamReader (socket.getInputStream())); String line; while ((line = rd.readLine()) != null) { System.out.println(line); } wr.close(); rd.close(); } catch (Exception e) { System.out.println(e.toString()); } } }
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!