Loading...

摘要: JDK的安装1.把JDK的ISO镜像文件挂载到linux操作系统上 mount/mnt/cdrom2.把文件拷贝到/home下 cp 文件 /home3.进入home目录下 cd /home4 安装镜像文件 ./???.bin5配置JDK环境变... 阅读全文
posted @ 2015-07-14 21:01 严康 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 在循环爬取得基础上进行多线程爬虫,本程序中使用的三个线程,线程为实现runnable接口,并使用对象锁防止并发共同去访问同一个对象。让三个线程同时爬去同一个url并且得到的新的url不重复。import java.io.*;import java.net.*;public clas... 阅读全文
posted @ 2015-07-14 19:23 严康 阅读(1437) 评论(0) 推荐(0) 编辑
摘要: 原理: 1.给一个URL,爬虫爬取这个url; 2.url中提取HTML中a 标签内容获取新的url; 3.再通过新的url再循环以上;实现代码:import java.io.*;import java.net.*;public class Dome1 { public st... 阅读全文
posted @ 2015-07-14 12:09 严康 阅读(679) 评论(0) 推荐(0) 编辑