一、今日学习内容
今天进行了对观影大数据的分析,对数据进行了数据清洗、数据分析,要求数据清洗要用大数据分析平台,数据分析用python
数据清洗
1、导入数据
2、缺失值处理
缺失记录仅___3___条,采取网上搜索,补全信息。
2、1补全release_date
缺失记录的电影标题为《_America Is Still the Place 》,日期为_2014-06-01__。
2、2补全runtime
3、重复值处理
运行结果:有__4803___个不重复的 id,可以认为没有重复数据。