pandas groupby

http://pandas.pydata.org/pandas-docs/stable/groupby.html

groupby一般分为3步:

1.分组

2.apply

3.组合

 

其中apply可以是聚合、转换、过滤等

应该把groupby和sql语句中的group by类比,几乎相同。

当时groupby会把dataframe转换成Serie,

如果我们一次传入多个数组,就会得到不同的结果:

>>> means = df['data1'].groupby([df['key1'], df['key2']]).mean()
>>> means
key1  key2
a     one    -0.714084
      two    -2.120793
b     one     0.642216
      two     0.975133
dtype: float64

这时结果已经不是一般的dataframe,使用df['key1']不能取出数据,如果想把这个转换成标准的dataframe,可以使用reset_index()。

 

posted on 2018-08-10 14:03  重八  阅读(191)  评论(0编辑  收藏  举报

导航