Pandas缺失数据处理

Pandas用np.nan代表缺失数据

reindex() 可以修改 索引,会返回一个数据的副本:

df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D','E'])
df1

df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D']+['E'])
df1

df1 = df.reindex(index=dates[0:4], columns=list(df.columns) + ['E'])
df1

df1.loc[dates[0]:dates[1],'E'] = 1
df1

 


对缺失值进行填充

df1.fillna(value=5)

df1['E'] = df1['E'].fillna(value=5)
df1

 

丢掉含有缺失项的行:

df1.dropna(how='any')

 


对缺失项布尔赋值

pd.isnull(df1)