pandas数据透视表pivot

pivot数据透视表

filepath = r"E:\Desktop\配套代码和数据集\配套代码和数据集\第3章:Pandas\Pandas代码\data\titanic.csv"
df = pd.read_csv(filepath)
df.pivot_table(index="Sex",columns="Pclass",values="Fare")#index为指定了按照什么属性来统计,columns指定了那个统计指标,values指定了
#统计的实际指标是什么。如果不指定指标是,默认是求平均值

#求最大值
df.pivot_table(index="Sex",columns="Pclass",values="Fare",aggfunc = "max")

#求最小值
df.pivot_table(index="Sex",columns="Pclass",values="Fare",aggfunc = "min")

#计数
df.pivot_table(index="Sex",columns="Pclass",values="Fare",aggfunc = "count")

#需求首先暗中年龄将乘客分为2组:成年人和未成年人,再对着两组乘客分别统计不同性别的人的平均获奖的可能性

df["Underaged"] = df["Age"] <= 18
df.pivot_table(index = "Underaged",columns="Sex",values="Survived",aggfunc="mean")
"""
#输出结果

Sex          female      male
Underaged                    
False      0.760163  0.167984
True       0.676471  0.338028


"""

学习的过程中,感觉pandas的数据透视表完全可以用groupby代替啊!!!

posted @   小杨的冥想课  阅读(52)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2021-04-11 NLP(十三)中文分词工具的使用尝试
2021-04-11 NLP(十二)依存句法分析的可视化及图分析
2021-04-11 NLP入门(十一)从文本中提取时间
2021-04-11 NLP入门(十)使用LSTM进行文本情感分析
2021-04-11 NLP入门(九)词义消岐(WSD)的简介与实现
2021-04-11 NLP入门(八)使用CRF++实现命名实体识别(NER)
2021-04-11 NLP入门(七)中文预处理之繁简体转换及获取拼音
点击右上角即可分享
微信分享提示