会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
芒果酱
博客园
首页
新随笔
联系
订阅
管理
2020年4月2日
爬取百度热榜
摘要: 一、设计方案 1.爬虫名称:爬取百度热榜 2.爬取内容:爬取网页热搜排名,标题,热度值。 3.方案概述:访问网页得到状态码200,分析网页源代码,找出所需要的的标签,逐个提取标签保存到相同路径csv文件中,读取改文件,进行数据清洗,数据模型分析,数据可视化处理,绘制分布图,用最小二乘法分析两个变量间
阅读全文
posted @ 2020-04-02 18:24 叶燕燕
阅读(3090)
评论(0)
推荐(1)
编辑
公告