Scrapy XPath语法
- selectors = response.xpath('[exp]')
返回所有符合exp的语句Selector列表
- data = response.xpath('[exp]')[0].extract()
返回Selector列表第一项的内容
- '/html/head'
从根节点匹配
- '//td/p'
从任意节点匹配
- '//td/p/../..'
从任意节点匹配上两级
- '//p/a/text()'
匹配文本内容
- '//p/a[@colspan="2"]'
匹配属性符合条件
- '//p/a/@href'
匹配属性
- response.xpath('//p/a/@href').re(".*cnblogs.com.*")
匹配符合正则的部分的列表
参考文献:http://blog.csdn.net/qzc295919009/article/details/42743077