|NO.Z.00046|——————————|BigDataEnd|——|Hadoop&Python.v10|——|Arithmetic.v10|Pandas数据分析库:Pandas简单统计指标|

一、数学和统计⽅法:简单统计指标
### --- 数学和统计⽅法
~~~     # pandas对象拥有⼀组常⽤的数学和统计⽅法。它们属于汇总统计,对Series汇总计算获取mean、max
~~~     # 值或者对DataFrame⾏、列汇总计算返回⼀个Series。
~~~     # 简单统计指标

import numpy as np
import pandas as pd
df = pd.DataFrame(data = np.random.randint(0,100,size = (20,3)),
                  index = list('ABCDEFHIJKLMNOPQRSTU'),
                  columns=['Python','Tensorflow','Keras'])
~~~     # 简单统计指标

df.count()                                                          # ⾮NA值的数量
df.max(axis = 0)                                                    # 轴0最⼤值,即每⼀列最⼤值
df.min()                                                            # 默认计算轴0最⼩值
df.median()                                                         # 中位数
df.sum()                                                            # 求和
df.mean(axis = 1)                                                   # 轴1平均值,即每⼀⾏的平均值
df.quantile(q = [0.2,0.4,0.8])                                      # 分位数
df.describe()                                                       # 查看数值型列的汇总统计,计数、平均值、标准差、最⼩值、四分位数、最⼤值
二、索引标签、位置获取
### --- 索引标签、位置获取

~~~     # 索引位置
df['Python'].argmin()                                               # 计算最⼩值位置
df['Keras'].argmax()                                                # 最⼤值位置
df.idxmax()                                                         # 最⼤值索引标签
df.idxmin()                                                         # 最⼩值索引标签
三、更多统计指标
### --- 更多统计指标

~~~     # 更多统计指标
df['Python'].value_counts()                                         # 统计元素出现次数
df['Keras'].unique()                                                # 去重
df.cumsum()                                                         # 累加
df.cumprod()                                                        # 累乘
df.std()                                                            # 标准差
df.var()                                                            # ⽅差
df.cummin()                                                         # 累计最⼩值
df.cummax()                                                         # 累计最⼤值
df.diff()                                                           # 计算差分
df.pct_change()                                                     # 计算百分⽐变化
四、高级统计指标
### --- ⾼级统计指标

~~~     # ⾼级统计指标
df.cov()                                                            # 属性的协⽅差
df['Python'].cov(df['Keras'])                                       # Python和Keras的协⽅差
df.corr()                                                           # 所有属性相关性系数
df.corrwith(df['Tensorflow'])                                       # 单⼀属性相关性系数

 
 
 
 
 
 
 
 
 

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
                                                                                                                                                   ——W.S.Landor

 

 

posted on   yanqi_vip  阅读(22)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示