摘要: 1.请求技术 URLConnection HttpClient 2.解析技术 Html Jsoup XML xPath Json Gson(Google)/FastJson(alibaba) 3.模拟器技术 4.抓包技术 阅读全文
posted @ 2020-01-31 19:30 Tsugar 阅读(1004) 评论(0) 推荐(0) 编辑
摘要: public static void main(String[] args) { //爬取最大资源网上的数据 //用CSS选择器 try { Document doc = Jsoup.parse(new URL("http://zuidazy2.net/"), 2000); Elements li 阅读全文
posted @ 2020-01-31 19:17 Tsugar 阅读(171) 评论(0) 推荐(0) 编辑
摘要: //爬虫://1.请求到某个网站去//2.返回一些HTML代码//3.从HTML代码提取你想要的信息 HTML解析//4.如果这些HTML中又有你感兴趣的内容//5.递归爬取//准备好网址 URL url = new URL("http://zuidazy2.net/"); //准备好连接 java 阅读全文
posted @ 2020-01-31 17:42 Tsugar 阅读(163) 评论(0) 推荐(0) 编辑