缺失值处理
缺失值填补:
1、用0填补
df.fillna(0)
2、中位数填补
df.fillna(df.median(),inplace=True)
当变量较多时,用中位数代替是一种稳健的方法。
3、均值填补
df.fillna(df.mean(),inplace=True)
4、众数填补
df.fillna(df.mode().iloc[0],inplace=True)
5、用一个字符串代替缺失值
df.fillna('missing')
缺失值填补:
1、用0填补
df.fillna(0)
2、中位数填补
df.fillna(df.median(),inplace=True)
当变量较多时,用中位数代替是一种稳健的方法。
3、均值填补
df.fillna(df.mean(),inplace=True)
4、众数填补
df.fillna(df.mode().iloc[0],inplace=True)
5、用一个字符串代替缺失值
df.fillna('missing')