pandas groupby
http://pandas.pydata.org/pandas-docs/stable/groupby.html
groupby一般分为3步:
1.分组
2.apply
3.组合
其中apply可以是聚合、转换、过滤等
应该把groupby和sql语句中的group by类比,几乎相同。
当时groupby会把dataframe转换成Serie,
如果我们一次传入多个数组,就会得到不同的结果:
>>> means = df['data1'].groupby([df['key1'], df['key2']]).mean() >>> means key1 key2 a one -0.714084 two -2.120793 b one 0.642216 two 0.975133 dtype: float64
这时结果已经不是一般的dataframe,使用df['key1']不能取出数据,如果想把这个转换成标准的dataframe,可以使用reset_index()。