python3下scrapy爬虫(第四卷:初步抓取网页内容之抓取网页里的指定数据延展方法)

上卷中我运用创建HtmlXPathSelector 对象进行抓取数据:

现在咱们再试一下其他的方法,先试一下我得最爱XPATH

看下结果:

直接打印出结果了

我现在就正常拼下路径 只求打印结果:

现在再说说 最常见的正则的用法说实话你要是初学者用很正常 我觉得正则不是特别好,但是还是要会的,它引入的模块与XPATH一样只需稍微修改些代码就行

使用方式分为两种

第一种:

直接对抓取结果进行匹配

第二种:

选择器内匹配

 

posted @ 2018-01-31 13:26  我爱在伊甸园吃苹果  阅读(444)  评论(0编辑  收藏  举报