随笔分类 - 爬虫
摘要:【简介】这里我们利用之前所学习的相关模块,爬取网站上top250的书单详情,最终我们将爬取出来的数据持久化存储为表格文件,使用sqlalchemy将持久化数据输入到postgresql数据库中 文章目录 1.爬取页面信息1.1导入所需模块1.2定义变量1.3.爬取数据1.4 完整代码如下 2.爬取网
阅读全文
摘要:【简介】 利用 Python 的 requests 库实现循环爬取某餐厅在北京的名单,并将抓取的数据保存为 JSON 格式的文件。 1. 导入模块以及所需要用到的库 本项目使用的是 requests 库和 json 库,因此需要导入这两个库。 import json import requests
阅读全文
摘要:【简介】利用 Python 的 requests 库实现循环爬取电影 TOP250 榜单,对每个电影的详细信息进行抓取,并将抓取的数据保存为 JSON 格式的文件。 文章目录 1.导入所需库和模块2. 构造请求参数并发送请求3. 解析数据并保存到文件4. 完整代码 1.导入所需库和模块 本项目使用的
阅读全文