使用python处理缺失数据

 

处理缺失数据:

方法 说明
dropna

根据各标签的值中 是否存在缺失数据对轴标签进行过滤,可通过阈值调节对缺失值的容忍程度

 

fillna

用指定值或插值方法(如ffill 或 bfill ) 填充缺失数据

 

isnull

返回一个含有布尔值的对象,这些布尔值表示哪些值是缺失值 NA ,该对象的类型与源类型一样

 

过滤缺失数据

       可以通过pandas.isnull或布尔索引的手工方法,但dropna可能会更实用一些。对于 series,dropna返回一个仅含非空数据和索引的series:

       dropna默认丢弃任何含有缺失值的行

填充缺失数据

参数 说明
value 用于填充缺失值的标量值或字典对象
method 插值方式。如果函数调用时未指定其他参数的话,默认为‘ffill’

 

参数 说明
axis 待填充的轴,默认axis=0
inplace 修改调用者对象而不产生副本
limit (对于前向和后向填充)可以连续填充的最大数量
   
posted @ 2019-06-26 11:23  leims  阅读(871)  评论(0编辑  收藏  举报