XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法
以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:
-
选择元素:
- 选择所有p元素:
//p
- 选择根元素:
/
- 选择所有p元素:
-
属性匹配:
- 选择class属性为"example"的div元素:
//div[@class='example']
- 选择class属性为"example"的div元素:
-
文本内容提取:
- 提取所有a元素的文本内容:
//a/text()
- 提取第一个p元素的文本内容:
//p[1]/text()
- 提取所有a元素的文本内容:
-
使用逻辑运算符:
- 选择同时具有class属性为"example"且id属性为"heading"的元素:
//*[@class='example' and @id='heading']
- 选择同时具有class属性为"example"且id属性为"heading"的元素:
-
使用位置谓词:
- 选择前三个li元素:
//li[position() <= 3]
- 选择最后一个p元素:
//p[last()]
- 选择前三个li元素:
-
使用通配符:
- 选择所有元素:
//*
- 选择div元素下的任意子元素:
//div/*
- 选择所有元素:
-
使用轴:
- 选择div元素的所有祖先元素:
//div/ancestor::*
- 选择span元素之后的所有兄弟元素:
//span/following-sibling::*
- 选择div元素的所有祖先元素:
以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。
本文由mdnice多平台发布
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端