会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
爬虫程序大魔王
博客园
首页
新随笔
联系
订阅
管理
2021年12月28日
爬虫系列:数据清洗
摘要:
上一期我们讲解了使用 Python 读取 CSV、PDF、Word 文档相关内容。 前面我们已经介绍了网络数据采集的一些基础知识,现在我们将进入高级数据采集部分。到目前为止,我们创建的网络爬虫都不是特别给力,如果网络服务器不能立即提供样式规范的信息,爬虫就不能采集正确的数据。如果爬虫只能采集那些显而
阅读全文
posted @ 2021-12-28 16:09 爬虫程序大魔王
阅读(771)
评论(0)
推荐(0)
编辑
公告