摘要: 网络爬虫名称:bilibili弹幕网视频日排行榜数据分析 网络爬虫爬取的内容:bilibili弹幕网视频日排行榜 设计方案概述: 实现思路:爬取网站html源代码,通过页面分析得到想要的数据位置,提取数据,之后数据可视化等操作 技术难点: html源码过于杂乱,难以提取数据 首先进行页面分析 通过页 阅读全文
posted @ 2020-04-21 14:48 唐雨涛 阅读(1580) 评论(0) 推荐(0) 编辑
摘要: 以上为页面结构 import pandas as pd import requests as rq from bs4 import BeautifulSoup url="http://tieba.baidu.com/hottopic/browse/topicList?res_type=1" def 阅读全文
posted @ 2020-03-21 16:55 唐雨涛 阅读(453) 评论(0) 推荐(0) 编辑