2023 年 3月 31 日随笔档案 - 乐之之

公告

2023年3月31日

scrapy爬虫框架（三）Spider的使用

摘要：在前面已经简单介绍了spider的基础用法，那么今天我们来详细了解一下Spider的具体用法。一、Spider的运行流程 spider是scrapy框架中最核心的组件，其定义了爬取网站的逻辑和解析方式，而spider主要做两件事情：定义爬取网站的动作。分析爬取下来的网页。那么他的运行流程主要阅读全文

posted @ 2023-03-31 19:59 乐之之阅读(753) 评论(0) 推荐(1) 编辑

scrapy爬虫框架（二）scrapy中Selector的使用

摘要：在scrapy框架前，相信大家或多或少的已经了解了一些网页数据解析方法，如：xpath、bs4、正则表达式等，但是在scrapy框架中也有一个内置的数据提取方法--Selector。在这里我们就先简单介绍一下Selector在scrapy中的运用及常用方法。为了方便示例，我们以官方文档中的示例页面阅读全文

posted @ 2023-03-31 10:48 乐之之阅读(321) 评论(0) 推荐(0) 编辑