摘要: 爬虫系列:数据清洗 上一期我们讲解了使用 Python 读取 CSV、PDF、Word 文档相关内容。 前面我们已经介绍了网络数据采集的一些基础知识,现在我们将进入高级数据采集部分。到目前为止,我们创建的网络爬虫都不是特别给力,如果网络服务器不能立即提供样式规范的信息,爬虫就不能采集正确的数据。如果爬虫只能采集那些显而 阅读全文
posted @ 2021-12-28 16:09 爬虫程序大魔王 阅读(771) 评论(0) 推荐(0) 编辑