Xpath基础学习
方法
-
获取文本
a/text()
获取a标签下的文本a//text()
获取a标签下所有标签的文本a[text()='xxx']
获取文本为xxx的a标签
-
@
符号a/@href
获取a标签的href的属性,其他属性获取方法相同a[@class='xxx']
获取class属性为xxx的a标签
-
//
获取当前位置下的所有标签a//sapn
获取a标签下的所有的span标签
例子
获取豆瓣电影排行榜的所有电影名:
1、
我们可以看到属于类为article
的div,我们写上//div[@class='article']
2、我们进一步发现该div下只有一个div,于是可以加上/div
,这样所有的影片块就被选中了
3、观察发现每一个电影都是一个table
4、进一步定位到属于一个类属性为pl2
的div下的a标签
5、追加//div[@class='pl2']/a//text()