pandas练习(三)------ 数据分组
探索酒类消费数据
相关数据见(github)
步骤1 - 导入pandas库
import pandas as pd
步骤2 - 数据集
path3 = "./data/drinks.csv" # drinks.csv
步骤3 将数据框命名为drinks
drinks = pd.read_csv(path3)
drinks.head()
输出:
步骤4 哪个大陆(continent)平均消耗的啤酒(beer)更多?
beeravg = drinks.groupby('continent').beer_servings.mean()
beeravg.sort_values(ascending=False)
输出:
步骤5 打印出每个大陆(continent)的红酒消耗(wine_servings)的描述性统计值
drinks.groupby('continent').wine_servings.describe()
输出:
步骤6 打印出每个大陆每种酒类别的消耗平均值
drinks.groupby('continent').mean()
输出:
步骤7 打印出每个大陆每种酒类别的消耗中位数
drinks.groupby('continent').median()
输出:
步骤8 打印出每个大陆对spirit饮品消耗的平均值,最大值和最小值
drinks.groupby('continent').spirit_servings.agg(['mean', 'min', 'max'])
输出:
参考链接:
1、http://pandas.pydata.org/pandas-docs/stable/cookbook.html#cookbook
2、https://www.analyticsvidhya.com/blog/2016/01/12-pandas-techniques-python-data-manipulation/
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步