乐之之

知而行乐,乐而行之,天道酬勤,学无止境。

2023年3月31日

scrapy爬虫框架(三)Spider的使用

摘要: 在前面已经简单介绍了spider的基础用法,那么今天我们来详细了解一下Spider的具体用法。 一、Spider的运行流程 spider是scrapy框架中最核心的组件,其定义了爬取网站的逻辑和解析方式,而spider主要做两件事情: 定义爬取网站的动作。 分析爬取下来的网页。 那么他的运行流程主要 阅读全文

posted @ 2023-03-31 19:59 乐之之 阅读(617) 评论(0) 推荐(1) 编辑
scrapy爬虫框架(二)scrapy中Selector的使用

摘要: 在scrapy框架前,相信大家或多或少的已经了解了一些网页数据解析方法,如:xpath、bs4、正则表达式等,但是在scrapy框架中也有一个内置的数据提取方法--Selector。在这里我们就先简单介绍一下Selector在scrapy中的运用及常用方法。 为了方便示例,我们以官方文档中的示例页面 阅读全文

posted @ 2023-03-31 10:48 乐之之 阅读(171) 评论(0) 推荐(0) 编辑