Xpath 语法笔记

/ 标识从根节点绝对路径的方式
/html/body

绝对路径的方式

// 标识相对路径
//div

相对路径方式

 

. 一个点,  .. 两个点

//title/.
表示当前节点

//title/./../
表示当前节点的父节点

 

多个标签通过索引获取

//div[3]

从1开始

 

获取多个标签中最后一个标签

//div[last()]

可以加减
//div[last() - 1]
//*[@id="content"]/div/div[2]/div/ul/li[last()]

 

获取多个标签中区间值

//div[position()<5]

//*[@id="content"]/div/div[2]/div/ul/li[position()<5]

 

修饰词位置

//*[@id="qiushi_tag_124086601"]
这样表示标记一个标签的特征

//*[@id="qiushi_tag_124086601"]/a/@href
//*[@id="content"]/div/div[2]/div/ul/li/@id
在a/@href 表示获取当前标签的属性值


 

[ ]里面可以用标签修饰

//*[@id="content"]/div/div[2]/div/ul/li[2][div[1]]

 

获取span标签数据大于450的标签

 

 

//div[@class="recmd-num"][span[1]>450]

 

包含关键词的方式获取数值

 

 

//li[contains(@id,"qiushi_tag_")]

 

通过包含文本内存查找

 

 

//span[contains(text(),"下一页")]

 

不同页面可能存在一套语法匹配不上可以使用 | 包含多套匹配规则

//div/a | //div/span

 

posted @ 2021-02-21 18:04  Anec  阅读(63)  评论(0编辑  收藏  举报