爬虫笔记之xpath

xpath如何取包含多个class属性

如果HTML结构是这样

<div class="demo"></div>

那么我知道可以写xpath //div[@class="demo"]
但是如果我的html是

<div class="test demo"></div>
<div class="demo test"></div>
<div class="test demo2"></div>

我只想选出有demo这个class的对象,那应该怎么弄

要取多个class属性值的元素,应该如何办呢;

如:

<div class='a b'>test</div>

如果是用xpath('//div[@class="a"]') 会取不到这里面的值;

可以用如下的表达式:

xpath('//div[contains(@class,"a")]')
它会取得所有classa的元素

或者

xpath('//div[contains(@class,"a") and contains(@class,"b")]')
它会取class同时有a和b的元素

and改为or,就是选择class=a或者class=b的元素

如果没记错的话可以这么来:

//div[contains(@class, 'demo')]

如果是多个则可以:

//div[contains(@class, 'demo') and contains(@class, 'other')]

如果目标 class 不一定是第一个,那么:

//div[contains(concat(' ', @class, ' '), 'demo')]

原文链接
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

xpath获取当前标签下的所有文本(包括子标签)

使用内建函数string

string(//div[@class="art_content"])
//获取"art_content"div下的所有内容
posted @ 2022-10-24 19:28  DaoDao777999  阅读(16)  评论(0编辑  收藏  举报