pandas常用的统计函数
https://blog.csdn.net/tz_zs/article/details/81252710
DataFrame 对象的常用计算方法(sum、mean、max、min、idxmax、idxmin、cumsum、mad、std、var、diff、pct_change、corr)
sum
求和 df.sum()
mean
求平均 df.mean
max、min
最大最小值 df.max、df.min
idxmax、idxmin
最大最小值的索引 df.idxmax、df.idxmin
cumsum
累加 df.cumsum
mad
根据平均值计算平均绝对离差 df.mad
std
标准差 df.std
var
方差 df.var
diff
一阶差分 df.diff
pct_change
百分数变化 df.pct_change
pandas.Series.pct_change 、 pandas.DataFrame.pct_change
corr
pandas.DataFrame.corr
计算列与列之间的相关性,不计算包括NA / null值的列。
DataFrame.corr(method='pearson', min_periods=1)
参数:
method:
pearson:皮尔逊相关系数
kendall:肯德尔等级相关系数
spearman:斯皮尔曼等级相关系数
min_periods:为获取有效结构,每对列所需的最小观察数据量
返回:
关于原始DataFrame列与列之间相关性的DataFrame对象。