01 2022 档案
摘要:一. 概述 在上一篇【爬虫】将scrapy部署到k8s文章中提到在自定义 spiderkeeper 镜像时报错,所以自己基于它的源码提交了一个叫做 spiderkeeper-new 的 python 包到 pypi 官网,本文将记录一下整个构建过程,希望对有同样需求的小伙伴提供一些帮助。 二. 上传
阅读全文
摘要:一. 概述 因为学习了 docker 和 k8s ,不管什么项目都想使用容器化部署😬,一个最主要的原因是,使用容器化部署是真的方便😎。上一篇文章 【爬虫】从零开始使用 Scrapy 介绍了如何使用 scrapy,如果需要启动或者定时运行 scrapy 项目可以部署如下两个组件: scrapyd:
阅读全文
摘要:一. 概述 最近有一个爬虫相关的需求,需要使用 scrapy 框架来爬取数据,所以学习了一下这个非常强大的爬虫框架,这里将自己的学习过程记录下来,希望对有同样需求的小伙伴提供一些帮助。 本文主要从下面几个方面进行介绍: 我的学习过程 需求分析 搭建项目 编写代码实现需求 部署爬虫项目到 Spider
阅读全文