简单理解pandas的groupby函数
pandas中的groupby函数,可以对数据进行分组,然后对分组后的数据进行聚合操作,比如求和、平均值、最大值、最小值等。平时使用groupby处理后,通常使用aggregate函数进行聚合操作。其实,groupby分组之后的聚合操作方法还很多,具体可以参考官方文档。
其中,name是员工姓名,salary是员工薪资,department是员工所属部门。问题是:如何找出每个部门最高的薪资?
其中,groupby对department就行分组处理;as_index=False表示不使用分组的列作为索引,否则会出现多级索引。aggregate函数表示对分组后的数据进行聚合操作,{'salary':'max'}表示对salary列进行最大值操作。
1. 读取数据
dataframe=pd.DataFrame({'name':['Joe','Jim','Henry','Sam','Max',],'salary':[70000,90000,80000,60000,90000,],'department':['IT','IT','Sales','Sales','IT',]})其中,name是员工姓名,salary是员工薪资,department是员工所属部门。问题是:如何找出每个部门最高的薪资?
2. groupby处理
dataframe_max= dataframe.groupby(['department'],as_index=False).aggregate({'salary':'max'})其中,groupby对department就行分组处理;as_index=False表示不使用分组的列作为索引,否则会出现多级索引。aggregate函数表示对分组后的数据进行聚合操作,{'salary':'max'}表示对salary列进行最大值操作。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 一文读懂知识蒸馏
· 终于写完轮子一部分:tcp代理 了,记录一下
2023-10-10 git上传至公共或私有github
2023-10-10 使用docker搭建虚拟专用网络服务
2023-10-10 docker搭建pypi服务,实现python包版本永久保存
2023-10-10 linux服务器搭建samba共享样例,通过windows登录共享