XPath表达式语法详解

自建博客地址:https://www.bytelife.net,欢迎访问! 本文为博客自动同步文章,为了更好的阅读体验,建议您移步至我的博客👇

本文作者: Jeffrey
本文链接: https://www.bytelife.net/articles/780.html
版权声明: 本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!


XPath路径表达式

XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。XPath使用路径表达式去确定XML文档中的节点。

示例XML文档

我们将利用下面的XML文档描述XPath语法

<?xml version="1.0" encoding="GB2312"?>

<order>
  <item catalog="parts">
    <itemNumber>C2688-67037</itemNumber>
    <description>LCD液晶显示器</description>
    <quantity>1</quantity>
    <price>358.00</price>
  </item>
 <item catalog="parts">
    <itemNumber>C2688-67061</itemNumber>
    <description>音箱</description>
    <quantity>1</quantity>
    <price>16.50</price>
  </item>
  <item catalog="parts">
    <itemNumber>C2688-67010</itemNumber>
    <description>鼠标</description>
    <quantity>1</quantity>
    <price>8.50</price>
  </item>
</order>

从根节点选取“/”

XML文挡可以表示为树结构节点形式 XPath使用模式表达式识别XML文档的节点。 一个XPath的模式是使用反斜杠“/”分开子元素名称描述路径 下面的XPath表达式选择元素order下元素item中的所有price元素

/order/item/price

注释:用“/”路径开始代表元素的绝对路径,不用“/”路径开始代表元素的相对路径

item/price

从整个文档选取“//”

用“//”路径开始代表整个文档满足条件的所有元素,不考虑它们的位置 下面的XPath表达式选择文档中所有的item元素

//item

选择未知元素“*”

通配符 “*”可用于选择未知XML元素 下面的XPath表达式选择元素order中的所有item元素所属的子元素

/order/item/*

下面的XPath表达式选择元素order下所有孙子辈的price元素

/order/*/price

下面的XPath表达式选择所有具有两个祖先的price元素

///price

下面的XPath表达式选择文档所有元素

//*

选择分支“[]”(谓语)

使用方括号[]可以指定特定的元素 下面的XPath表达式选择元素order中的第一个item的子元素

/order/item[1]

下面的XPath表达式选择元素order中的最后一个item的子元素

/order/item[last()]

下面的XPath表达式选择元素order中具有price元素的item元素

/order/item[price]

下面的XPath表达式,从元素order中选择具有price等于12.60元素的item元素

/order/item[price=16.50]

下面的XPath表达式,从隶属于元素order的item元素中选择具有price等于12.60元素的price元素

/order/item[price=16.50]/price

选择几个路径“|”

在XPath表达式中,使用 "|" 运算符可以选择几个路径 。实质上是逻辑“与”操作 下面的XPath表达式,从隶属于order的item元素中选择所有itemNumber 和description 元素

/order/item/itemNumber | /order/item/description

下面的XPath表达式,从文档中选择所有itemNumber 和description 元素

//itemNumber | //description

下面的XPath表达式,从文档中选择所有itemNumber ,description和price 元素

//itemNumber | //description | //price

下面的XPath表达式,选取属于order中item下所有itemNumber元素和从文档中选择所有description元素

/order/item/itemnumber | //description

选择属性“@”

在XPath中,所有属性使用@前缀 下面的XPath表达式,选取所有名为catalog的属性

//@catalog

下面的XPath表达式,选取所有具有catalog属性的item元素

//item[@catalog]

下面的XPath表达式,选取所有具有任何属性的item元素

//item[@*]

下面的XPath表达式,选取所有具有catalog等于"parts"属性的item元素

//item[@catalog="parts"]

总结

(1)选取节点 下面列出了最有用的路径表达式:

表达式 描述
nodename 选取此节点的所有子节点。
/ 从根节点选取。
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
. 选取当前节点。
.. 选取当前节点的父节点。
@ 选取属性。

(2)谓语(Predicates) 谓语用来查找某个特定的节点或者包含某个指定的值的节点。 谓语被嵌在方括号[]中。 (3)选取未知节点 XPath 通配符可用来选取未知的 XML 元素。

通配符 描述
* 匹配任何元素节点。
@* 匹配任何属性节点。
node() 匹配任何类型的节点。

(4)选取若干路径 通过在路径表达式中使用“|”运算符,您可以选取若干个路径。 更多有关XPath语法规则请访问W3CSchool

posted @ 2021-02-25 01:01  JeffreyHu  阅读(674)  评论(0编辑  收藏  举报