2019 年 7月 24 日随笔档案 - gkimeeq

2019年7月24日

摘要： `Spider`类定义如何爬取指定的一个或多个网站，包括是否要跟进网页里的链接和如何提取网页内容中的数据。爬取的过程是类似以下步骤的循环： 1. 类 2.爬虫参数爬虫可以接受参数来改变它的行为。这些参数一般用来定义初始URL，或者限定爬取网站的部分内容，也可以用来配置其它任何功能。在运行命令阅读全文

posted @ 2019-07-24 17:20 gkimeeq 阅读(197) 评论(0) 推荐(0) 编辑

公告