Pandas 汇总计算
排除NaN值
df['内容'].dropna()
计算平均数
mean_ = df['age'].mean()
多个列的平均数
result = df[['age', 'height']].describe()
result.count().age # 取值
groupby
result = df[['age', 'sex']].groupby('sex').mean()
# 方式二
result = df.groupby('sex')['age'].mean()
也可以多个列分组
result = df.groupby(['sex', 'origin'])['age'].mean()
每个类别的数量 value_counts()
value_count_ = df['笔记类型'].value_counts()
# 该函数是一个快捷方式,因为它实际上是一个groupby操作,结合了对每个组中记录数的计数
# value_count_ = df.groupby('笔记类型')['笔记类型'].count()
分组统计
按照一列的分组,统计另一列的值出现的次数
df['*市'].groupby(df['结束时间']).value_counts()
# 使用groupby在多列上的Value_counts
df = df.groupby(['城市', '结束时间']).agg({'网站名称': 'value_counts', '房屋用途': 'value_counts'})