摘要: 存储海量数据 数据持久化的首选方案应该是关系型数据库,关系型数据库的产品很多,包括:Oracle、MySQL、SQLServer、PostgreSQL等。如果要存储海量的低价值数据,文档数据库也是不错的选择,MongoDB是文档数据库中的佼佼者,有兴趣的读者可以自行研究。 下面的代码演示了如何使用M 阅读全文
posted @ 2020-09-02 16:03 Laney_Sun 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 数据采集和解析 通过上一个章节的讲解,我们已经了解到了开发一个爬虫需要做的工作以及一些常见的问题,下面我们给出一个爬虫开发相关技术的清单以及这些技术涉及到的标准库和第三方库,稍后我们会一一介绍这些内容。 下载数据 - urllib / requests / aiohttp / httpx。 解析数据 阅读全文
posted @ 2020-09-02 14:17 Laney_Sun 阅读(195) 评论(0) 推荐(0) 编辑