简单理解pandas的groupby函数

pandas中的groupby函数,可以对数据进行分组,然后对分组后的数据进行聚合操作,比如求和、平均值、最大值、最小值等。平时使用groupby处理后,通常使用aggregate函数进行聚合操作。其实,groupby分组之后的聚合操作方法还很多,具体可以参考官方文档。

1. 读取数据

dataframe=pd.DataFrame({'name':['Joe','Jim','Henry','Sam','Max',],'salary':[70000,90000,80000,60000,90000,],'department':['IT','IT','Sales','Sales','IT',]})
其中,name是员工姓名,salary是员工薪资,department是员工所属部门。问题是:如何找出每个部门最高的薪资?

2. groupby处理

dataframe_max= dataframe.groupby(['department'],as_index=False).aggregate({'salary':'max'})
其中,groupby对department就行分组处理;as_index=False表示不使用分组的列作为索引,否则会出现多级索引。aggregate函数表示对分组后的数据进行聚合操作,{'salary':'max'}表示对salary列进行最大值操作。
posted @   stone9693  阅读(94)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 一文读懂知识蒸馏
· 终于写完轮子一部分:tcp代理 了,记录一下
历史上的今天:
2023-10-10 git上传至公共或私有github
2023-10-10 使用docker搭建虚拟专用网络服务
2023-10-10 docker搭建pypi服务,实现python包版本永久保存
2023-10-10 linux服务器搭建samba共享样例,通过windows登录共享
GitHub账户:https://github.com/stone9693
点击右上角即可分享
微信分享提示