爬虫篇:Xpath
一、 xpath的基本使用
简介:XPath 是一门在 XML 文档中查找信息的语言
# 一般解析库都会有子的的搜索标签的方法,一般都会支持css和xpath
# 一般使用:
div 找div标签
----------------------------------------
/ 找当前路径下的标签
/div/a
----------------------------------------
// 找当前路径子子孙孙下的标签
-/div//a
----------------------------------------
. 表示当前路径
----------------------------------------
.. 表示上一层
./div/a
../div/a
----------------------------------------
@ 表示取属性
//body//a[contains(@class,"li")]
//body//a[@href="image1.html"]
//a//text()
//a//@href
# 终极大招,复制,copy xpath
//*[@id="cnblogs_post_body"]/p[9]/strong