python3下scrapy爬虫(第四卷:初步抓取网页内容之抓取网页里的指定数据延展方法）

上卷中我运用创建HtmlXPathSelector 对象进行抓取数据：

现在咱们再试一下其他的方法，先试一下我得最爱XPATH

看下结果：

直接打印出结果了

我现在就正常拼下路径只求打印结果：

现在再说说最常见的正则的用法说实话你要是初学者用很正常我觉得正则不是特别好，但是还是要会的，它引入的模块与XPATH一样只需稍微修改些代码就行

使用方式分为两种

第一种：

直接对抓取结果进行匹配

第二种：

选择器内匹配

posted @ 2018-01-31 13:26 我爱在伊甸园吃苹果阅读(444) 评论(0) 编辑收藏举报

刷新页面返回顶部