Pandas-reindex中关于填充缺失值的几个方法
在学习Pandas时,当对一个Series或者DataFrame进行重新索引时,需要用到pandas.Series.reindex()或者pandas.DataFrame.reindex()。当某个索引值不存在时,会直接引入缺失值NaN。我们可以通过填充的方式,使Series或者DataFrame中新的index拥有新的索引。这篇文章整理下reindex中关于填充缺失值的几个方法
索引对象是无法修改的,因此,重新索引是指对索引重新排序而不是重新命名,如果某个索引值不存在的话,会引入缺失值
obj.reindex(['a','b','c','d','e']) #重新填充
对于重建索引引入的缺失值,可以利用fill_value参数填充。
对于顺序数据,比如时间序列,重新索引时可能需要进行插值或填值处理,利用参数method选项可以设置:
method = ‘ffill’或‘pad’,表示前向值填充 (#根据前面的值填充)
method = ‘bfill’或‘backfill’,表示后向值填充(#根据后面的值填充)