摘要: 主要利用python结合爬虫和可视化技术对《青春有你2》的进行简单的数据统计与分析。 利用前面文章介绍的scrapy框架对爱奇艺官方助力网站进行数据爬取,不过这里涉及到动态网页的抓取,根据下面的网页分析有两种方案,一是需要配合selenium和谷歌驱动浏览器无头模式一起使用,再根据网页标签进行解析,二是直接请求网页的动态地址,返回json格式的选手数据。通过爬虫,我们可以获取小姐姐们的一些数据,包括:姓名、出生日期、身高体重等信息,以及他们的美照。 阅读全文
posted @ 2020-04-19 17:15 fahaiAI 阅读(1355) 评论(0) 推荐(0) 编辑