python 分组统计

import pandas as pd
data1_group=data1['count_num'].groupby(data1['i_week'])
i2=data1_group.mean()
print(pd.DataFrame(i2))
print(data1_group.size())
print(data1_group.agg({'mean':'mean','sum':'sum'}))

  分组统计:将数据集data1的count_num按照i_week的数值分组计算均值

  比如count_num是每天的销售额; i_week是今天是星期几的分类变量,那么这个计算的意思就是:分别求周一周二周三周四周五周六周日的平均销售额

  

  data1_group  →将data1按照i_week分组后的数据

  i2  →周一周二周三周四周五周六周日的平均销售额

  data1_group.size()  →周一周二周三周四周五周六周日各有几天

  data1_group.agg({'MEAN':'mean','SUM':'sum'})  →周一周二周三周四周五周六周日的平均销售额和总销售额

 

后续补充:简单的分组计数

df1_gp=df1.groupby('nyr')  #将df1按照nyr字段分组
df1_gp_count=df1_gp.count()  #计算每个字段的分组计数结果,并把结果赋给df1_gp_count

 

posted @ 2020-04-13 15:58  Shilo  阅读(3561)  评论(0编辑  收藏  举报