4.分组聚合
以此为例
一.groupby
参数名 | 接受 | 含义 | 默认 |
---|---|---|---|
by | List string mapping generator |
1.若为函数,则对索引进行计算并分组 2.若为字典/series,则将字典/series的值做为分组依据 3.若为Numpy数组,则以数组元素为分组依据 4.若为字符串/字符串列表,则以其所代表的字段进行分组 |
无 |
axis | Int | 表示操作轴向 | 0 |
level | Int / 索引名 | 标签所在级别 | None |
as_index | Boolean | 聚合后的聚合标签是否以DataFrame输出 | Ture |
group_keys | Boolean | 是否显示标签名称 | Ture |
squeeze | Boolean | 是否在允许的情况下对返回数据降维 | False |
1.groupby转化
DataFrame.groupby(by='列名')
示例
二.数据拆分
函数名 | 作用 | 示例 |
---|---|---|
count | 计算数组数目 | |
head | 返回每组前n个值 | |
mean | 返回每个组的均值 | |
median | 返回每个组的中位数 | |
cumcount | 对组成员进行标记 | |
size | 返回每个组的大小 | |
max | 返回每个组最大值 | |
min | 返回每个组最小值 | |
std | 返回每个组标准错 | |
sum | 返回每个组和 |
三.聚合
1.agg/aggregate
参数名称 | 接收 | 意义 | 默认 |
---|---|---|---|
func | List/dict/function | 用于每行或每列 | 无 |
axis | 0/1 | 0行1列 | 0 |
(1)具体聚合
agg({'列名':'数学函数' })
聚合内容重命名
agg({'列名':('新列名','数学函数') })
(2)同类聚合
agg({数学函数1,数学函数2,.....数学函数n})
2.apply
参数名称 | 接收 | 意义 | 默认 |
---|---|---|---|
func | List/dict/function | 用于每行或每列 | 无 |
axis | 0/1 | 0行1列 | 0 |
Broadcast | Boolean | 是否广播 | Flas |
Raw | Boolean | 是否将ndarray穿给函数 | Flas |
Reduce | Boolean/None | 返回值格式 | None |
(1)同类聚合
apply(数学函数)