摘要: htmlparser是一个纯的java写的html解析的库,它不依赖于其它的java库文件,主要用于改造或提取html。它能超高速解析html,而且不会出错。现在htmlparser最新版本为2.0。下载地址:http://sourceforge.net/projects/htmlparser/在线API:http://www.ostools.net/apidocs/apidoc?api=HTMLParserFilter就是对于结果进行过滤,取得需要的内容。HTMLParser在org.htmlparser.filters包之内一共定义了15个不同的FilterAndFilter、CssSel 阅读全文
posted @ 2013-07-15 19:21 苏二 阅读(6056) 评论(2) 推荐(1) 编辑