摘要: 一:网络爬虫设计方案 爬虫名称:爬取爱奇艺热播榜并处理分析 爬取内容:热播榜的影视剧名称与对应的热度 设计方案概述: 1.找到要爬取的网页,使用F12查看源代码,找到我们要爬取的数据 2.使用get请求和beautifulsoup解析工具进行爬取数据 3.使用pandas进行数据可视化 4.使用ma 阅读全文
posted @ 2020-04-09 10:45 黄榕 阅读(1444) 评论(0) 推荐(0) 编辑
摘要: 从网页源代码中找到我们需要爬取的标签且是html结构,爬取目标为class=’job_titile'和class='job_content' import requests from bs4 import BeautifulSoup import bs4 import pandas as pd #引 阅读全文
posted @ 2020-03-17 20:41 黄榕 阅读(238) 评论(0) 推荐(0) 编辑