摘要: 这期的爬虫是爬取“简书”的搜索结果页,篇幅将会分为两部分来写,第一部分是爬虫部分,主要涉及搜索文章的提取和数据保存,第二部分涉及基本的数据分析和可视化,本篇文章属于爬虫篇。 爬虫源代码 首先看一下整个爬虫的源代码,每个函数的用处已经写在函数说明中,后面也会进行代码解读。 爬虫思路 基本思路 爬虫的基 阅读全文
posted @ 2017-10-31 11:11 晴空行 阅读(806) 评论(0) 推荐(0) 编辑