数据视角可视化分析豆瓣电影评分爬虫数据

原文链接:http://tecdat.cn/?p=26988

原文出处:拓端数据部落公众号

豆瓣已经成为国内影迷和影评人的聚集地。 豆瓣评分已经成为评价中国电影的重要指标。 豆瓣积累了大量的电影数据,为电影行业分析提供了重要资源。 豆瓣电影被用来衡量国内外电影的发展。

中国与其他国家对比

汇总年电影总产量。 一直在快速推进的电影产业在2017年出现转折,电影产量开始下滑。 与现在相比,相差1500部左右。 这种趋势一直持续。 

中国大陆的评分低于整体评分,然后我们选择电影数量排名前三的国家与中国大陆进行比较。 日本电影的质量非常好,评分一直保持在平均水平以上。 中国大陆、美国和日本的电影评分差距很大。 美国电影评分更高。

总体而言,近年来电影产量有所下降,但评分有所上升。 怀疑两者之间存在联系。

电影类型烂片分析

再来看看拍摄偏好和烂片率。 现在烂片越来越多。 现在让我们从数据的角度来看。

按烂片率降序排列,不良片定义为:评分低于3.35分(5.9-1.5*(7.6-5.9))。 每种类型的电影数量需要大于200。

​​​
众所周知,日本有丰富的情色和动画电影,战争片的烂片率最低,其次是悬疑片。 中国恐怖惊悚片的烂片率非常高,不建议观看。 而且,国产电影包揽了豆瓣烂片前五名:女娲日记拿下豆瓣烂片之王,得分倒数第,接着是怨灵宿舍之白纸女生、女导演连环杀人案、灵异实录

​​​

电影数量分析

统计每个国家的电影数量,选出前4名的观察值:

豆瓣采用打星的方式,所以最低分是一星,也就是两分。

影片数量超过500部,综合评分和数量后,前4名的国家或地区:

在豆瓣,收录在电影里。 虽然美国、中国大陆、日本都有大量的电影。 但平均评分低于法国、英国、德国和意大利。 其中,德国的电影评分均值最高,英国的电影数量最多,这意味着相对而言,德国电影的质量最高。 从离散值也可以看出,英国部分数据的离散值非常低,比如:《围攻唐宁街》,豆瓣评分2.4分,但还是没有国产神剧2.0分低。 豆瓣包括电影500+的国家或地区,大部分为发达国家,或中国、印度等人口大国,说明电影数量可能与一个国家或地区的发展水平有一定的关系。

本文章中的所有信息(包括但不限于分析、预测、建议、数据、图表等内容)仅供参考,拓端数据(tecdat不因文章的全部或部分内容产生的或因本文章而引致的任何损失承担任何责任。


最受欢迎的见解

1.R语言动态图可视化:如何、创建具有精美动画的图

2.R语言生存分析可视化分析

3.Python数据可视化-seaborn Iris鸢尾花数据

4.r语言对布丰投针(蒲丰投针)实验进行模拟和动态

5.R语言生存分析数据分析可视化案例

6.r语言数据可视化分析案例:探索brfss数据数据分析

7.R语言动态可视化:制作历史全球平均温度的累积动态折线图动画gif视频图

8.R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

9.python主题LDA建模和t-SNE可视化

posted @ 2022-06-15 16:06  拓端tecdat  阅读(457)  评论(0编辑  收藏  举报