09 2022 档案

scrapy框架之item与pipelines

摘要：继续以起点小说为例子，我们要做的就是把对象存储到item（类似于一个字典）中，在通过pipelines持久化到txt文件中。之前我们在运行爬虫的后面加“-o 爬虫名称” 这样很方便，但是也有很多的弊端，比如只能存为特定的格式，像txt这种就不可以。同时在使用pipelines存储前可以写一些存储前阅读全文

posted @ 2022-09-24 11:55 尤所不同阅读(55) 评论(0) 推荐(0) 编辑

scrapy框架之生成存储文件json，xml、csv文件

摘要：以起点小说网举例子网址 https://www.qidian.com/rank/yuepiao/ 默认大家已经生成好scrapy项目了，如果不会请参考我之前的文章scrapy框架之创建项目运行爬虫爬取网页获取元素位置通过XPath Helper插件检查是否爬取成功编写爬虫文件 1.先在控制阅读全文

posted @ 2022-09-22 20:38 尤所不同阅读(62) 评论(0) 推荐(0) 编辑

scrapy框架之创建项目运行爬虫

摘要：创建scrapy scrapy startproject 项目名称创建蜘蛛（爬虫文件） scrapy genspider 蜘蛛名称网址爬取网页（举百度的列子）编写爬虫文件 import scrapy class BaiduSpider(scrapy.Spider): name = 'baid 阅读全文

posted @ 2022-09-22 19:47 尤所不同阅读(35) 评论(1) 推荐(0) 编辑

Ubuntu修改APT的访问服务器地址

摘要：修改APT的访问服务器地址 Ubuntu的软件资源配置文件etc/apt/sources.list 步骤 1.备份ubuntu的默认地址(防止改错) sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak 2.清空sources.list ec 阅读全文

posted @ 2022-09-15 19:25 尤所不同阅读(152) 评论(0) 推荐(0) 编辑

安装ubuntu

摘要：ubuntu是一个以桌面应用为主的开源CNU/Linux操作系统，专业的Python开发者一般会选择Ubuntu这款Linux系统作为生产平台. 安装地址 https://cn.ubuntu.com/download/desktop 通过VMware安装ubuntu 设置后不会立刻生效，下次登录才会阅读全文

posted @ 2022-09-14 19:11 尤所不同阅读(30) 评论(0) 推荐(0) 编辑

公告

昵称：尤所不同
园龄： 2年10个月
粉丝： 1
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

尤所不同

尤所不同

09 2022 档案

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论