摘要:
根据条件对数据集排序(sorting)也是一种重要的内置运算。要对行或列索引进行排序(按字典顺序), 可使用sort_index 方法, 它将返回一个已排序的新对象: 而DataFrame, 则可以根据任意一个轴上的索引进行排序: 降序 数据默认是按照升序排序的, 但也可以安装降序排序 按值排序 如 阅读全文
摘要:
阅读全文
摘要:
Pandas 讲解 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。 pandas提供了大量能使我们快速便捷地处理数 阅读全文
摘要:
pandas 还有一个重要的功能,就是他可以对不同索引的对象进行算数运算。对象相加, 如果存在不同的索引对,则结果的索引就是该索引对的并集。 先来个例子 Series In [33]: s1 = Series([7.3, -2.5, 3.4, 1.5], index=['a', 'c', 'd', 阅读全文
摘要:
apply Numpy 的ufuncs通用函数(元素级数组方法)也可用于操作pandas对象: 另一个常见的操作是,将函数应用到由各列或行所形成的一维数组上。Dataframe的apply方法即可实现此功能: sum 和mean 许多最为常见的数组统计功能都被实现成DataFrame的方法(如sum 阅读全文