摘要: 参考了好多人的算法,但感觉太深奥了,自己写了一个,感觉效果还可以,不过还是有很多杂质在里面成功率没有测试过,以后校验。 public static String extractContent(String url) { Document document = JsoupUitl.readUrl(url); String orderHtml = document.toString().toLowerCase(); orderHtml = orderHtml.replaceAll("(?is)", ""); orderHtml = or... 阅读全文
posted @ 2014-01-08 22:43 杨桃 阅读(304) 评论(0) 推荐(0) 编辑