复制代码

Scrapy框架立项

一、安装Scrapy

 pip install scrapy

二、创建scrapy项目

scrapy startproject my_spider

三,创建爬虫文件

scrapy genspider example example.com

#example 文件名称
#example.com 爬取网站地址
#如:scrapy genspider baidu baidu.com

出现下图就创建成功

 四、运行刚才创建的爬虫文件

scrapy crawl baidu

五、用代码运行Scrapy项目

import scrapy
from scrapy import cmdline #导入这个文件


class QingtingSpider(scrapy.Spider):
    name = "qingting"
    allowed_domains = ["m.qingting.fm"]
    start_urls = ["https://m.qingting.fm/rank/"]

    def parse(self, response):
        print('测试',response)
        pass


if __name__ == '__main__':
    cmdline.execute('scrapy crawl qingting'.split()) #写入这行代码

六、scrapy变量声明

#首先需要导入HtmlResponse包
from scrapy.http import HtmlResponse

如何在parse函数中使用
    def parse(self, response:HtmlResponse):
        print('测试',response)

        pass

 

posted @ 2024-02-21 14:05  怪~咖  阅读(4)  评论(0编辑  收藏  举报
复制代码