lidaye2396

博客园 首页 新随笔 联系 订阅 管理

一、今日学习内容

今天进行了对观影大数据的分析,对数据进行了数据清洗、数据分析,要求数据清洗要用大数据分析平台,数据分析用python

数据清洗

1、导入数据

 

2、缺失值处理

 

 

缺失记录仅___3___条,采取网上搜索,补全信息。

2、1补全release_date

 

 

 

 

缺失记录的电影标题为《_America Is Still the Place 》,日期为_2014-06-01__。

2、2补全runtime

 

3、重复值处理

 

运行结果:有__4803___个不重复的 id,可以认为没有重复数据。

posted on 2021-12-08 20:53  lidaye2396  阅读(35)  评论(0编辑  收藏  举报