摘要: 一. 基本概念 1. Selector是一个可独立使用的模块,我们可以用Selector类来构建一个选择器对象,然后调用它的相关方法如xpaht(), css()等来提取数据,如下 from scrapy import Selector body= '<html><head><title>Hello 阅读全文
posted @ 2018-08-01 17:39 坚强的小蚂蚁 阅读(4626) 评论(0) 推荐(0) 编辑
摘要: 使用爬取http://quotes.toscrape.com/内容,网站内容很简单 一. 使用scrapy创建项目 二. 修改items.py和quotes.py items.py用来保存爬取的数据,和字典的使用方法一样 网页源文件中只需提取上面定义的3个字段 quotes.py 其中的parse函 阅读全文
posted @ 2018-08-01 12:08 坚强的小蚂蚁 阅读(259) 评论(0) 推荐(0) 编辑