Scrapy框架立项

一、安装Scrapy

 pip install scrapy

二、创建scrapy项目

scrapy startproject my_spider

三，创建爬虫文件

scrapy genspider example example.com

#example 文件名称
#example.com 爬取网站地址
#如：scrapy genspider baidu baidu.com

出现下图就创建成功

四、运行刚才创建的爬虫文件

1	`scrapy crawl baidu`

五、用代码运行Scrapy项目

import scrapy
from scrapy import cmdline #导入这个文件
 
 
class QingtingSpider(scrapy.Spider):
    name = "qingting"
    allowed_domains = ["m.qingting.fm"]
    start_urls = ["https://m.qingting.fm/rank/"]
 
    def parse(self, response):
        print('测试',response)
        pass
 
 
if __name__ == '__main__':
    cmdline.execute('scrapy crawl qingting'.split()) #写入这行代码

六、scrapy变量声明

#首先需要导入HtmlResponse包
from scrapy.http import HtmlResponse

如何在parse函数中使用
    def parse(self, response:HtmlResponse):
        print('测试',response)

        pass

posted @ 2024-02-21 14:05 怪~咖阅读(7) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Scrapy 爬虫小案例

· python 爬虫模板

· scrapy框架简介

· scarpy框架使用

· scrapy爬虫框架

阅读排行：
· 无需6万激活码！GitHub神秘组织3小时极速复刻Manus，手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· 什么是nginx的强缓存和协商缓存
· 一文读懂知识蒸馏
· Manus爆火，是硬核还是营销？

公告

昵称：怪~咖
园龄： 3年9个月
粉丝： 9
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

清雪

Scrapy框架立项

公告

搜索

常用链接

最新随笔

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论