【原创】数据处理中判断空值的方法(np.isnan、is np.nan和pd.isna)比较
1、np.isnan(只有数组数值运算时可使用)
注意:numpy模块的isnan方法仅支持对数值进行判断,因此传入的如果是字符串类型会报错
2、is np.nan(不建议使用)
如果我们的空值只会出现由numpy模块的nan,或只想判断由numpy模块生成的nan值,可以使用,但其他场合一律不建议使用
注意:因为math模块同样可以产生nan值,且math.nan由is np.nan判断是False,例如下面代码
1 a = math.nan 2 b = np.nan 3 4 a is b 5 Out[19]: False 6 7 np.isnan(a) 8 Out[20]: True 9 np.isnan(b) 10 Out[21]: True 11 12 a is np.nan 13 Out[22]: False 14 b is np.nan 15 Out[23]: True
3、pd.isna(大部分数据处理的场合推荐使用)
如果我们的空值既会出现np.nan,也会出现math.nan,甚至还会出现None,或者要判断的数据值既可能是数值型也可能是字符串(符合大部分场景的实际情况),墙裂推荐使用pd.isna,例如下面代码
1 pd.isna(np.nan) 2 Out[29]: True 3 pd.isna(math.nan) 4 Out[30]: True 5 pd.isna(None) 6 Out[31]: True 7 pd.isna('a') 8 Out[32]: False 9 pd.isna(10) 10 Out[33]: False
I'm coming back!