摘要: `Spider`类定义如何爬取指定的一个或多个网站,包括是否要跟进网页里的链接和如何提取网页内容中的数据。 爬取的过程是类似以下步骤的循环: 1. 类 2.爬虫参数 爬虫可以接受参数来改变它的行为。这些参数一般用来定义初始URL,或者限定爬取网站的部分内容,也可以用来配置其它任何功能。 在运行 命令 阅读全文
posted @ 2019-07-24 17:20 gkimeeq 阅读(191) 评论(0) 推荐(0) 编辑