摘要: 一、主题式网络爬虫设计方案(15分) 1.主题式网络爬虫名称:爬取微博热搜top50 2.主题式网络爬虫的内容与数据特征分析:排名 关键词 点击量 3.主题式网络爬虫设计方案概述: 先分析页面 对比源代码找出规律,然后对网页进行爬取,再对爬取的数据进行分析和可视化。 二、主题页面的结构特征分析(15 阅读全文
posted @ 2020-04-23 20:32 颜Jason 阅读(760) 评论(1) 推荐(0) 编辑
摘要: 源代码 import requestsfrom bs4 import BeautifulSoupimport pandas as pdurl="https://tophub.today/n/Jb0vmloB1G"headers = {'User-Agent':'Mozilla/5.0 (Window 阅读全文
posted @ 2020-03-21 12:55 颜Jason 阅读(327) 评论(0) 推荐(0) 编辑