合并重叠数据
还有一种数据组合问题不能用简单的合并(merge)或连接(concat(concatenation))运算来处理。
Numpy
比如说, 你可能有索引全部或部分重叠的两个数据集。给这个例子增加一点启发性, 我们使用Numpy的where函数,
它用于表达一种矢量化的if-else:
Series
Series有一个combine_first方法, 实现了也是一样的功能, 而且会进行数据对齐:
DataFrame
对于DataFrame, combine_first自然也会在列上做同样的事情, 因此你可以将其看做:
用参数对象中的数据为调用者对象的缺失数据“打补丁”:
作者:沐禹辰
出处:http://www.cnblogs.com/renfanzi/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。
出处:http://www.cnblogs.com/renfanzi/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。