Pandas缺失数据处理

Pandas用np.nan代表缺失数据

reindex() 可以修改索引，会返回一个数据的副本:

df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D','E'])
df1

df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D']+['E'])
df1

df1 = df.reindex(index=dates[0:4], columns=list(df.columns) + ['E'])
df1

df1.loc[dates[0]:dates[1],'E'] = 1
df1

对缺失值进行填充

df1.fillna(value=5)

df1['E'] = df1['E'].fillna(value=5)
df1

丢掉含有缺失项的行:

df1.dropna(how='any')

对缺失项布尔赋值

pd.isnull(df1)

发表于 2018-12-17 15:22 守护式等待阅读(276) 评论(0) 收藏举报