摘要: 使用Jsoup.connect(url).get()连接某网站时偶尔会出现java.net.SocketTimeoutException:Read timed out异常。原因是默认的Socket的延时比较短,而有些网站的响应速度比较慢,所以会发生超时的情况。解决方法:链接的时候设定超时时间即可。d... 阅读全文
posted @ 2015-08-18 10:53 243573295 阅读(11724) 评论(0) 推荐(0) 编辑
摘要: Jsoup是一个非常好的解析网页的包,用java开发的,提供了类似DOM,CSS选择器的方式来查找和提取文档中的内容。1.下载地址http://jsoup.org/download中文文档资料:http://www.open-open.com/jsoup/比较好的文档:http://www.osto... 阅读全文
posted @ 2015-08-18 10:49 243573295 阅读(331) 评论(0) 推荐(0) 编辑
摘要: 案例import java.util.regex.Matcher; import java.util.regex.Pattern; /** * * Title: HTML相关的正则表达式工具类 * * * Description: 包括过滤HTML标记,转换HT... 阅读全文
posted @ 2015-08-18 10:44 243573295 阅读(1577) 评论(0) 推荐(0) 编辑