# 2020-09-29 #「Front End」- 使用 XPath 选择元素

XPath,是在 XSLT 标准中的主要元素,用于在 XML 文档中选择元素,我们可以理解为元素选择器(功能上与 CSS Selectors 类似)。

我们感觉XPath 比 CSS Selector 好用,也可能是我们不熟悉 CSS 选择器,也可能是我们的场景使然。

学习路线(Learning Roadmap)

按照 w3school.com 章节顺序进行学习即可:
1)形成 XPath 基本认识:XPath Tutorial
2)理解基本概念,比如 Parent、Children、Ancestors 等等:XPath Nodes
3)学习 XPath 语法:XPath Syntax
4)相对于当前节点定位其他节点:XPath Axes
5)使用操作符进行判断:XPath Operators
6)学习示例:XPath Examples

如何调试 XPath 查询?

方法一、通过浏览器直接获取

我们可以使用 Chrome / Firefox 快速获取元素的 XPath 地址。下面是 Chrome 的方法:

Inspect => Right click on the node => Copy => Copy XPath

方法二、使用 Console 调试

在 Chrome / Firefox 的 Console 中,使用 $x('your-xpath-query') 函数,

比如:通过 $x("//img") 选择所有图片

常用的 XPath 查询(我们比较常用)

获取在兄弟元素中的元素

html - XPath:: Get following Sibling - Stack Overflow

获取在 div 的后续所有兄弟(sibling)元素中的 input 元素:

//div/following-sibling::input

根据属性值的内容定位属性

XPath with regex match on an attribute value - Stack Overflow
How to use not contains() in xpath? - Stack Overflow

定位 href 属性包含 doubles 字符串的 a 标签:

//a[contains(@href, ' doubles ')]

定位 href 属性不包含 doubles 字符串的 a 标签:

//a[not(contains(@href, ' doubles '))]

参考文献

K4NZ / 使用 XPath 选择元素
w3schools.com/XPath Tutorial
XPath - XML Path Language (XPath)
Scrapy/Docs » Selectors
Is there a way to get the XPath in Google Chrome? - Stack Overflow
How to validate XPath using Firefox Web Developer Plugin? - Stack Overflow


posted @ 2020-09-29 00:23  研究林纳斯写的  阅读(84)  评论(0编辑  收藏  举报