Webcollector之Pagg第一篇--获取标签属性

Page 可以通过获取html的标签非常的容易,也一定提供了获取属性的方法。奈何自己不太注意,吃了点小亏,所以特殊记录一下~~~~

Element div = page.select("div[class=postDesc]").first();
Element a = div.getElementsByAttribute("href").first();
String href = a.attr("href");

代码如上,获取标签节点之后,可以通过attr()方法获取指定的属性value,通常有些链接WebCollector没有自动获取(暂时没搞懂为啥,可能是因为链接是相对路径,而且当前链接不为根链接),需要自己手工解析处理
posted @ 2017-04-11 01:01  疯脸A刃甲  阅读(1398)  评论(1编辑  收藏  举报