缺失值处理

缺失值填补:

1、用0填补

df.fillna(0)

2、中位数填补

df.fillna(df.median(),inplace=True)

当变量较多时,用中位数代替是一种稳健的方法。

3、均值填补

df.fillna(df.mean(),inplace=True)

4、众数填补

df.fillna(df.mode().iloc[0],inplace=True)

5、用一个字符串代替缺失值

df.fillna('missing')

 

posted @ 2018-12-11 15:36  Christina_笔记  阅读(634)  评论(0编辑  收藏  举报