Scrapy XPath语法

  • selectors = response.xpath('[exp]')

返回所有符合exp的语句Selector列表

  • data = response.xpath('[exp]')[0].extract()

返回Selector列表第一项的内容

  • '/html/head'

从根节点匹配

  • '//td/p'

从任意节点匹配

  • '//td/p/../..'

从任意节点匹配上两级

  • '//p/a/text()'

匹配文本内容

  • '//p/a[@colspan="2"]'

匹配属性符合条件

  • '//p/a/@href'

匹配属性

  • response.xpath('//p/a/@href').re(".*cnblogs.com.*")

匹配符合正则的部分的列表

 

参考文献:http://blog.csdn.net/qzc295919009/article/details/42743077

posted @ 2017-07-11 21:09  jhc888007  阅读(319)  评论(0编辑  收藏  举报