pandas常用的统计函数

https://blog.csdn.net/tz_zs/article/details/81252710

 DataFrame 对象的常用计算方法(sum、mean、max、min、idxmax、idxmin、cumsum、mad、std、var、diff、pct_change、corr)

 

 

 

sum

求和 df.sum()

 

 

 

mean

求平均 df.mean

 

 

 

max、min

最大最小值 df.max、df.min

 

 

 

idxmax、idxmin

最大最小值的索引 df.idxmax、df.idxmin

 

 

 

cumsum

累加 df.cumsum

 

 

 

mad

根据平均值计算平均绝对离差 df.mad

 

 

 

std

标准差 df.std

 

 

 

 

var

方差 df.var

 

 

diff

一阶差分 df.diff

 

 

pct_change

百分数变化 df.pct_change

pandas.Series.pct_change 、 pandas.DataFrame.pct_change

 

 

corr
pandas.DataFrame.corr

计算列与列之间的相关性,不计算包括NA / null值的列。

DataFrame.corr(method='pearson', min_periods=1)

参数:

method:

pearson:皮尔逊相关系数
kendall:肯德尔等级相关系数
spearman:斯皮尔曼等级相关系数
min_periods:为获取有效结构,每对列所需的最小观察数据量

返回:
关于原始DataFrame列与列之间相关性的DataFrame对象。

 

 

 

posted @ 2021-04-17 17:29  正在学Python  阅读(393)  评论(0编辑  收藏  举报