XPath学习笔记(一)

什么是XPath?

XPath代表的意思是“XML Path Language”,是一种采用“路径语法”来识别和查找XML文档结点的语言。

XPath的基本术语:

1、结点(Nodes):

分类:在XPath中,结点分为7类,分别是:元素(element),属性(attribute),文本(text),命名空间(namespace),处理指令(processing-instruction),注释(comment),和文件结点(document nodes)。

XML文档被当作由结点组成的树形结构来处理,位于树最顶端的结点称为根元素节点(root element node)。

请看下面一段XML代码:

<?xml version="1.0" encoding="UTF-8"?>

<bookstore>
  <book>
    <title lang="en">Harry Potter</title>
    <author>J K. Rowling</author>
    <year>2005</year>
    <price>29.99</price>
  </book>
</bookstore> 
<bookstore>(根元素结点)
<author>J K. Rowling</author>(元素结点)
lang="en"(属性结点)

 

2、原子值(Atomic values):

没有孩子结点或父亲结点的结点。比如:

J K. Rowling
"en"

 

3、名目(Items):

原子值或结点。

 

参考文献:https://www.w3schools.com/xml/xpath_nodes.asp

posted @ 2019-07-27 22:37  hilovexy  阅读(135)  评论(0编辑  收藏  举报