数据分析常用的方法总结

医院销售数据分析案例关键知识点

读取

data = pd.read_excel('chao.xlsx',dtype='object')

为了防止数据类型不一致,先统一用object类型导入

重新给列命名

dataDF.rename(columns={"购药时间": "销售时间"}, inplace=True)

数据类型转换

dataDF["销售数量"] = dataDF["销售数量"].astype("f8")

 

这里的f8是float64的意思

字符串转时间格式,错误强转

dataDF.loc[:, "销售时间"] = pd.to_datetime(dataDF.loc[:, "销售时间"], errors='coerce')

根据时间计算天数

daysI = (endTime - startTime).days

业务指标

月均消费次数 = 总消费次数 / 月份数

月均消费金额 = 总消费金额 / 月份数

客单价 = 总消费金额 / 总消费次数

消费趋势

常见画图属性设置

 

 

绘图时防止中文报错

  1. from pylab import mpl
     mpl.rcParams['font.sans-serif'] = ['SimHei']
     
posted @ 2020-01-09 11:00  猪啊美  阅读(190)  评论(0编辑  收藏  举报