>> np.nan == np.nan
False
>> np.nan is np.nan
True

>> math.nan is np.nan
False
>> np.isnan(math.nan)
True

1. 判断 ndarray 中是否存在 nan

>> c = np.array([ 1.,  2., np.nan,  3.,  4.])
>> np.isnan(c)
array([False, False,  True, False, False])

# 注意
>> np.nan != np.nan
True

>> np.nan in c
False

上述方案要么返回的是一个序列,要么给出的是错误的结果。判断 numpy 下的多维数组中是否存在 nan 的简单方式:

>> np.isnan(np.min(c))
True
>> np.isnan(np.sum(c))
True

# 因为
>> np.min(c)
nan
>> np.sum(c)
nan

2. 将 nan 填充为均值

>> c = np.array([ 1.,  2., np.nan,  3.,  4.])
>> c[np.isnan(c)] = np.mean(c[~np.nan(c)])
posted on 2018-05-21 23:25  未雨愁眸  阅读(831)  评论(0编辑  收藏  举报