pandas汇总和计算描述统计
pandas 对象拥有一组常用的数学和统计方法。 他们大部分都属于简约和汇总统计, 用于从Series中提取单个值(如sum或mean)
或从DataFrame的行或列中提取一个Series。跟对应的Numpy数组方法对比, 他们都是基于没有缺失数据的假设而构建的。
看例子:
sum方法
调用DataFrame的sum方法将会返回一个含有列小计的Series:
行求和
传入axis=1 将会按行进行求和运算:
自动排除NA值
除非整个切片(这里指的是行或列)都是NA。通过skipna选项可以禁用该功能:
间接统计(比如累加, 最大id等)
一次性产生多个汇总统计:describe
方法
d1.count() #非空元素计算 d1.min() #最小值 d1.max() #最大值 d1.idxmin() #最小值的位置,类似于R中的which.min函数 d1.idxmax() #最大值的位置,类似于R中的which.max函数 d1.quantile(0.1) #10%分位数 d1.sum() #求和 d1.mean() #均值 d1.median() #中位数 d1.mode() #众数 d1.var() #方差 d1.std() #标准差 d1.mad() #平均绝对偏差 d1.skew() #偏度 d1.kurt() #峰度 d1.describe() #一次性输出多个描述性统计指标
作者:沐禹辰
出处:http://www.cnblogs.com/renfanzi/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。
出处:http://www.cnblogs.com/renfanzi/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。