Xpath 语法笔记
/ 标识从根节点绝对路径的方式
/html/body
绝对路径的方式
// 标识相对路径
//div
相对路径方式
. 一个点, .. 两个点
//title/.
表示当前节点
//title/./../
表示当前节点的父节点
多个标签通过索引获取
//div[3]
从1开始
获取多个标签中最后一个标签
//div[last()]
可以加减
//div[last() - 1]
//*[@id="content"]/div/div[2]/div/ul/li[last()]
获取多个标签中区间值
//div[position()<5] //*[@id="content"]/div/div[2]/div/ul/li[position()<5]
修饰词位置
//*[@id="qiushi_tag_124086601"]
这样表示标记一个标签的特征
//*[@id="qiushi_tag_124086601"]/a/@href
//*[@id="content"]/div/div[2]/div/ul/li/@id
在a/@href 表示获取当前标签的属性值
[ ]里面可以用标签修饰
//*[@id="content"]/div/div[2]/div/ul/li[2][div[1]]
获取span标签数据大于450的标签
//div[@class="recmd-num"][span[1]>450]
包含关键词的方式获取数值
//li[contains(@id,"qiushi_tag_")]
通过包含文本内存查找
//span[contains(text(),"下一页")]
不同页面可能存在一套语法匹配不上可以使用 | 包含多套匹配规则
//div/a | //div/span
既要脚踏实地,也需仰望天空