python 分组统计
import pandas as pd data1_group=data1['count_num'].groupby(data1['i_week']) i2=data1_group.mean() print(pd.DataFrame(i2)) print(data1_group.size()) print(data1_group.agg({'mean':'mean','sum':'sum'}))
分组统计:将数据集data1的count_num按照i_week的数值分组计算均值
比如count_num是每天的销售额; i_week是今天是星期几的分类变量,那么这个计算的意思就是:分别求周一周二周三周四周五周六周日的平均销售额
data1_group →将data1按照i_week分组后的数据
i2 →周一周二周三周四周五周六周日的平均销售额
data1_group.size() →周一周二周三周四周五周六周日各有几天
data1_group.agg({'MEAN':'mean','SUM':'sum'}) →周一周二周三周四周五周六周日的平均销售额和总销售额
后续补充:简单的分组计数
df1_gp=df1.groupby('nyr') #将df1按照nyr字段分组
df1_gp_count=df1_gp.count() #计算每个字段的分组计数结果,并把结果赋给df1_gp_count
以上为全部内容■■■