开课吧--Python数据分析--第8节 搭上时间分析的飞剑--互动练习:销售额的华山论剑
题目要求
现在我们有一份某电商超市从2016年到2019年的部分销售数据,路径为:/data/course_data/data_analysis/Commerce.xls 我们的字段有订单 ID,客户对象,订单日期,邮寄方式,地区,地区经理,销售额,数量,退回,折扣等,在这些字段下面,一共有近一万条数据。
题目讲解
请根据数据完成下面的需求: 1. 分别算出2016年到2019年,每年5月份的总销售额。 2. 2018年各地区的5月份的总销售额对比。
书写代码
import pandas as pd
df = pd.read_excel('/data/course_data/data_analysis/Commerce.xls')
# 读取数据
df.set_index('订单日期',inplace=True)
# 将"订单日期"设为行索引
# 1. 分别算出2016年到2019年,每年5月份的总销售额
sales16 = df['2016-5']['销售额'].sum()
sales17 = df['2017-5']['销售额'].sum()
sales18 = df['2018-5']['销售额'].sum()
sales19 = df['2019-5']['销售额'].sum()
# 2. 2018年各地区的5月份的总销售额对比
sales2018 = df['2018-5']
# 筛选2018年5月份数据
groups = sales2018.groupby('地区')
# 按"地区分组"
groups['销售额'].sum()
# 计算各地区总销售额
for group_name,group_df in groups:
print(group_name,group_df['销售额'].sum())
# 第二种计算方法