2021.12.9 观影大数据分析

一、今日学习内容

今天进行了对观影大数据的分析,对数据进行了数据清洗、数据分析,要求数据清洗要用大数据分析平台,数据分析用python

数据清洗

1、导入数据

 

2、缺失值处理

 

 

缺失记录仅___3___条,采取网上搜索,补全信息。

21补全release_date

 

 

 

缺失记录的电影标题为《_America Is Still the Place 》,日期为_2014-06-01__。

2、2补全runtime

 

3、重复值处理

 

运行结果:有__4803___个不重复的 id,可以认为没有重复数据。

 

posted @ 2021-12-09 22:16  小仙女W  阅读(61)  评论(0编辑  收藏  举报