通过HtmlCleaner与xpath解析html内容时出现的问题

使用 HtmlCleaner 和xpath结合起来解析html内容时，按理来说，只要给TagNode的 evaluateXPath方法传入要解析的元素的xpath（xpath的获取直接在控制台右键复制即可），就可以得到一个Object数组。

但是，我获得的数组长度为0。

我自己做的时候遇到结果为0的情况有以下的两种

1. 查看HTML对应元素的xpath时，并没有留意到该元素其实是通过js或者xhr的方法后续加载的，也即是传说中的异步加载？

2. 其次，不同的浏览器获取到的xpath是不同的，如下有个对比

给evaluateXPath方法传入火狐浏览器获取到的xpath时并没有得到预期的结果，360浏览器获取到的xpath可以获取正确结果

后面这一点的原因还有待深究，如果你知道原因，麻烦在评论下留下您的见解，谢谢~

posted @ 2019-12-17 20:36 一去二三浪里小白龙阅读(548) 评论(0) 编辑收藏举报

刷新页面返回顶部

吴武陵