摘要: 1.CrawlSpider介绍 CrawlSpider其实是Spider的一个子类,除了继承到Spider的特性和功能外,还派生除了其自己独有的更加强大的特性和功能。其中最显著的功能就是”LinkExtractors链接提取器“。Spider是所有爬虫的基类,其设计原则只是为了爬取start_url 阅读全文
posted @ 2019-06-29 22:39 麦小秋 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 1.Scrapy框架介绍 Scrapy是一个基于Twisted的异步处理框架,是纯Python实现的爬虫框架,其架构清晰,榄块之间的榈合程度低,可扩展性极强,可以灵活完成各种需求。 Engine:引擎,处理整个系统的数据流处理、触发事务,是整个框架的核心。 Item:项目,它定义了爬取结果的数据结构 阅读全文
posted @ 2019-06-29 21:07 麦小秋 阅读(328) 评论(0) 推荐(0) 编辑