观影大数据分析(3)

8.数据分析

8.1 why

想要探索影响票房的因素,从电影市场趋势,观众喜好类型,电影导演,发行时间,评分与 关键词等维度着手,给从业者提供合适的建议。

8.2 what

8.2.1 电影类型:定义一个集合,获取所有的电影类型

genre = set()

for i in df['genres'].str.split(','): # 去掉字符串之间的分隔符,得到单个电影类型

    genre = set().union(i,genre)    # 集合求并集

    # genre.update(i) #或者使用update方法

print(genre)

#注意到genre集合中存在多余的元素:空的单引号,所以需要去除

genre.discard('') # 去除多余的元素

genre

8.2.1.1条形图

8.2.1.2饼图

8.2.1.3折线图

8.2.2 电影关键词(keywords 关键词分析,绘制词云图)

8.3 when

查看 runtime 的类型,发现是 object 类型,也就是字符串,所以,先进行数据转化。

8.3.1 电影时长(绘制电影时长直方图)

8.3.2 绘制每月电影数量和单片平均票房

8.4 Who

8.4.1 分析票房分布及票房 Top10 的导演

8.5 How

8.5.1 原创 VS 改编占比(饼图)

8.5.2 原创 VS 改编预算/利润率(组合图)

posted @ 2021-12-16 20:27  鯨落  阅读(108)  评论(0编辑  收藏  举报