Scrapy XPath语法

selectors = response.xpath('[exp]')

返回所有符合exp的语句Selector列表

data = response.xpath('[exp]')[0].extract()

返回Selector列表第一项的内容

'/html/head'

从根节点匹配

'//td/p'

从任意节点匹配

'//td/p/../..'

从任意节点匹配上两级

'//p/a/text()'

匹配文本内容

'//p/a[@colspan="2"]'

匹配属性符合条件

'//p/a/@href'

匹配属性

response.xpath('//p/a/@href').re(".*cnblogs.com.*")

匹配符合正则的部分的列表

参考文献：http://blog.csdn.net/qzc295919009/article/details/42743077

posted @ 2017-07-11 21:09 jhc888007 阅读(319) 评论(0) 编辑收藏举报

刷新页面返回顶部