--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
##按照一列分组统计
#按照一列分组统计 import pandas as pd pd.set_option ('display.unicode.east_asian_width',True) df=pd.read_excel('电脑配件销售记录.xlsx') print (df) print ('4.-----------------------------------------------------') df1=df[['产品名称','数量','标准单价']] #print (dfl) print (df1.groupby('产品名称', as_index=False).sum()) #对数量,标准单价都进行求和统计
#as_index=False,表示是否把行标签当索引
产品名称 销售员 数量 标准单价 成交金额 0 键盘 王丽 120 180 21600 1 无线网卡 王丽 10 178 1780 2 蓝牙适配器 李桂林 61 108 6588 3 蓝牙适配器 李桂林 18 108 1944 4 蓝牙适配器 李桂林 39 108 4212 5 键盘 华国华 20 180 3600 6 鼠标 李桂林 16 299 4784 7 麦克风 华国华 47 99 4653 8 DVD光驱 华国华 48 240 11520 9 SD存储卡 李桂林 20 290 5800 10 手写板 华国华 14 190 2660 11 手写板 王丽 43 190 8170 12 DVD光驱 华国华 40 240 9600 13 SD存储卡 李桂林 15 290 4350 14 DVD光驱 王丽 32 240 7680 15 SD存储卡 李欢 9 290 2610 16 鼠标 王双 52 299 15548 4.----------------------------------------------------- 产品名称 数量 标准单价 0 DVD光驱 120 720 1 SD存储卡 44 870 2 手写板 57 380 3 无线网卡 10 178 4 蓝牙适配器 118 324 5 键盘 120 180 6 键盘 20 180 7 麦克风 47 99 8 鼠标 68 598
##按照多列分组统计
#按照多列分组统计 import pandas as pd pd.set_option ('display.unicode.east_asian_width',True) df=pd.read_excel('电脑配件销售记录.xlsx') print (df) print ('4.-----------------------------------------------------') df1=df[['产品名称','销售员','数量']] #print (dfl) print (df1.groupby(['产品名称','销售员']).sum()) #对数量进行求和
数量 产品名称 销售员 DVD光驱 华国华 88 王丽 32 SD存储卡 李桂林 35 李欢 9 手写板 华国华 14 王丽 43 无线网卡 王丽 10 蓝牙适配器 李桂林 118 键盘 王丽 120 键盘 华国华 20 麦克风 华国华 47 鼠标 李桂林 16 王双 52
##按照分组按照指定列进行计算
#按照分组按照指定列进行计算 import pandas as pd pd.set_option ('display.unicode.east_asian_width',True) df=pd.read_excel('电脑配件销售记录.xlsx') print (df) print ('4.-----------------------------------------------------') df1=df[['产品名称','数量','标准单价']] df2=df1.groupby('产品名称')['数量'].sum() print (df2)
产品名称 DVD光驱 120 SD存储卡 44 手写板 57 无线网卡 10 蓝牙适配器 118 键盘 120 键盘 20 麦克风 47 鼠标 68 Name: 数量, dtype: int64