python3下scrapy爬虫(第四卷:初步抓取网页内容之抓取网页里的指定数据延展方法)
上卷中我运用创建HtmlXPathSelector 对象进行抓取数据:
现在咱们再试一下其他的方法,先试一下我得最爱XPATH
看下结果:
直接打印出结果了
我现在就正常拼下路径 只求打印结果:
现在再说说 最常见的正则的用法说实话你要是初学者用很正常 我觉得正则不是特别好,但是还是要会的,它引入的模块与XPATH一样只需稍微修改些代码就行
使用方式分为两种
第一种:
直接对抓取结果进行匹配
第二种:
选择器内匹配