合并重叠数据

还有一种数据组合问题不能用简单的合并(merge)或连接(concat(concatenation))运算来处理。

Numpy

比如说, 你可能有索引全部或部分重叠的两个数据集。给这个例子增加一点启发性, 我们使用Numpy的where函数, 

它用于表达一种矢量化的if-else:

 

Series

Series有一个combine_first方法, 实现了也是一样的功能, 而且会进行数据对齐:

 

 DataFrame

 对于DataFrame, combine_first自然也会在列上做同样的事情, 因此你可以将其看做:

用参数对象中的数据为调用者对象的缺失数据“打补丁”:

 

posted @ 2017-03-06 16:11  我当道士那儿些年  阅读(413)  评论(0编辑  收藏  举报