pandas数据透视表pivot
pivot数据透视表
filepath = r"E:\Desktop\配套代码和数据集\配套代码和数据集\第3章:Pandas\Pandas代码\data\titanic.csv"
df = pd.read_csv(filepath)
df.pivot_table(index="Sex",columns="Pclass",values="Fare")#index为指定了按照什么属性来统计,columns指定了那个统计指标,values指定了
#统计的实际指标是什么。如果不指定指标是,默认是求平均值
#求最大值
df.pivot_table(index="Sex",columns="Pclass",values="Fare",aggfunc = "max")
#求最小值
df.pivot_table(index="Sex",columns="Pclass",values="Fare",aggfunc = "min")
#计数
df.pivot_table(index="Sex",columns="Pclass",values="Fare",aggfunc = "count")
#需求首先暗中年龄将乘客分为2组:成年人和未成年人,再对着两组乘客分别统计不同性别的人的平均获奖的可能性
df["Underaged"] = df["Age"] <= 18
df.pivot_table(index = "Underaged",columns="Sex",values="Survived",aggfunc="mean")
"""
#输出结果
Sex female male
Underaged
False 0.760163 0.167984
True 0.676471 0.338028
"""
学习的过程中,感觉pandas的数据透视表完全可以用groupby代替啊!!!
记录学习的点点滴滴