python 基础之scrapy

安装:
install scrapy # -i https://pipy.douban.com/simple 不一定好用改其他源码
创建scrapy项目的命令:
scrapy startproject <项目名字>
创建爬虫命令:在项目路径下执行:

`scrapy genspider <爬虫名字> <允许爬取的域名>`
scrapy genspider baidu   www.baidu.com

运行项目:
scrapy crawl 爬虫名字 [--nolog]

import scrapy

class BaiduSpider(scrapy.Spider):
    name = "baidu"  # 运行项目名字
    allowed_domains = ["www.baidu.com"]  # 域名
    start_urls = ["https://www.baidu.com"] # 开发爬取的网页

    def parse(self, response):  # 运行爬虫
        print(response)     # response 响应的数据
posted @ 2024-07-16 08:53  donghongchao  阅读(6)  评论(0编辑  收藏  举报