pandas数据透视表pivot

pivot数据透视表

filepath = r"E:\Desktop\配套代码和数据集\配套代码和数据集\第3章:Pandas\Pandas代码\data\titanic.csv"
df = pd.read_csv(filepath)
df.pivot_table(index="Sex",columns="Pclass",values="Fare")#index为指定了按照什么属性来统计,columns指定了那个统计指标,values指定了
#统计的实际指标是什么。如果不指定指标是,默认是求平均值

#求最大值
df.pivot_table(index="Sex",columns="Pclass",values="Fare",aggfunc = "max")

#求最小值
df.pivot_table(index="Sex",columns="Pclass",values="Fare",aggfunc = "min")

#计数
df.pivot_table(index="Sex",columns="Pclass",values="Fare",aggfunc = "count")

#需求首先暗中年龄将乘客分为2组:成年人和未成年人,再对着两组乘客分别统计不同性别的人的平均获奖的可能性

df["Underaged"] = df["Age"] <= 18
df.pivot_table(index = "Underaged",columns="Sex",values="Survived",aggfunc="mean")
"""
#输出结果

Sex          female      male
Underaged                    
False      0.760163  0.167984
True       0.676471  0.338028


"""

学习的过程中,感觉pandas的数据透视表完全可以用groupby代替啊!!!

posted @ 2023-04-11 16:09  小杨的冥想课  阅读(33)  评论(0编辑  收藏  举报