摘要: 爬虫系列:读取 CSV、PDF、Word 文档 上一期我们讲解了使用 Python 读取文档编码的相关问题,本期我们讲解使用 Python 处理 CSV、PDF、Word 文档相关内容。 CSV 我们进行网页采集的时候,你可能会遇到 CSV 文件,也可能项目需要将数据保存到 CSV 文件。Python 有一个超赞的标准库可以读写 CSV 文件。虽 阅读全文
posted @ 2021-12-21 16:33 爬虫程序大魔王 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 爬虫系列:读取文档 上一篇文章我们介绍了如何通过 MySQL 存储 Python 爬虫采集的内容,以及使用Python 与 MySQL 交互,这篇文章我们介绍如何通过 Python 读取文档。 虽然互联网在20世纪60年代末期就已经以不同的形式出现,但是 HTML 直到1992年才问世。在此之前,互联网上基本就是收发邮 阅读全文
posted @ 2021-12-21 15:30 爬虫程序大魔王 阅读(177) 评论(0) 推荐(0) 编辑