摘要: java定时任务实现方法: 1 public class TimingTask { 2 private static int count = 0; 3 private static SpiderService service = null; 4 public static void startTask(int hour,int minute,int second) { 5 TimerTask task = new TimerTask() { 6 @Override 7 publi... 阅读全文
posted @ 2014-01-16 16:37 wq920 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 版本HttpClient3.11、GET方式第一步、创建一个客户端,类似于你用浏览器打开一个网页HttpClient httpClient = new HttpClient();第二步、创建一个GET方法,用来获取到你需要抓取的网页URLGetMethod getMethod = new GetMethod("http://www.baidu.com");第三步、获得网址的响应状态码,200表示请求成功int statusCode = httpClient.executeMethod(getMethod);第四步、获取网页的源码byte[] responseBody = g 阅读全文
posted @ 2014-01-16 16:27 wq920 阅读(420) 评论(0) 推荐(0) 编辑
摘要: HTMLParser获取属性名方式:原始网页文本:1 美军被曝虐尸2温岭鞋厂大火32014春运全国启动4汪峰章子怡同居5透视年会经过parser处理后文本:parser匹配代码:1 NodeFilter filter1 = new HasAttributeFilter("a");2 NodeFilter filter2 = new HasAttributeFilter("title");3 4 5 //NodeFilter innerFilter = new TagNameFilter ("... 阅读全文
posted @ 2014-01-16 16:16 wq920 阅读(588) 评论(0) 推荐(0) 编辑