摘要: #章节十六:复习与反爬虫 ##1. 爬虫总复习 我还记得事情是从这张图开始的,它被用来描述浏览器的工作原理: 请求和响应。这两件事几乎构成了我们后面的所有学习内容。 在第0关,我们说爬虫,就是利用程序在网上拿到对我们有用的数据。程序所做的,最关键步骤正是“请求”和“响应”。 据此,我们定义了“爬虫四 阅读全文
posted @ 2022-06-29 10:14 退役小学生 阅读(45) 评论(0) 推荐(0) 编辑
摘要: #章节十五:Scrapy实操 ##1. 复习 上一关,我们学习了Scrapy框架,知道了Scrapy爬虫公司的结构和工作原理。 在Scrapy爬虫公司里,引擎是最大的boss,统领着调度器、下载器、爬虫和数据管道四大部门。 这四大部门都听命于引擎,视引擎的需求为最高需求。 我们还通过实操爬取豆瓣To 阅读全文
posted @ 2022-06-29 10:13 退役小学生 阅读(70) 评论(0) 推荐(0) 编辑