通过HtmlCleaner与xpath解析html内容时出现的问题

使用 HtmlCleaner 和xpath结合起来解析html内容时,按理来说,只要给TagNode的 evaluateXPath方法传入要解析的元素的xpath(xpath的获取直接在控制台右键复制即可),就可以得到一个Object数组。

但是,我获得的数组长度为0。

 

我自己做的时候遇到结果为0的情况有以下的两种

1. 查看HTML对应元素的xpath时,并没有留意到该元素其实是通过js或者xhr的方法后续加载的,也即是传说中的异步加载?

2. 其次,不同的浏览器获取到的xpath是不同的,如下有个对比

 

 给evaluateXPath方法传入火狐浏览器获取到的xpath时并没有得到预期的结果,360浏览器获取到的xpath可以获取正确结果

 

后面这一点的原因还有待深究,如果你知道原因,麻烦在评论下留下您的见解,谢谢~

posted @ 2019-12-17 20:36  一去二三浪里小白龙  阅读(548)  评论(0编辑  收藏  举报
//增加一段JS脚本,为目录生成使用