代码改变世界

scrapy 相关问题

2014-06-18 14:39  briller  阅读(147)  评论(0编辑  收藏  举报

爬取text 包含某个关键字时

zhibo_unicode = unicode("直播","utf-8")

 

sel.xpath('//a[contains(span/text(),"%s")]/@href' % zhibo_unicode)              只能用%s占位符这种类似的方式。      

以下方式是不对的:

sel.select('//a[contains(span/text(),zhibo_unicode)]')