12月07日总结-观影数据集之大数据分析-数据清洗

1.    导入数据

 

2  缺失值处理

 

总共4803条数据

Homepage3091

Overview3

Release_data1

Runtime2

Tagline844

2.1补全 release_date

 

添加日期:

df['release_date'] = df['release_date'].fillna('2014-06-01')

补全 runtime

 

 

df.loc[2656] = df.loc[2656].fillna('94, limit=1')
df.loc[4140] = df.loc[4140].fillna('240, limit=1')


3.重复值处理

无重复值

 

posted on 2021-12-07 21:30  lkwkk  阅读(33)  评论(0编辑  收藏  举报