数据分析常用的方法总结
医院销售数据分析案例关键知识点
读取
data = pd.read_excel('chao.xlsx',dtype='object')
为了防止数据类型不一致,先统一用object类型导入
重新给列命名
dataDF.rename(columns={"购药时间": "销售时间"}, inplace=True)
数据类型转换
dataDF["销售数量"] = dataDF["销售数量"].astype("f8")
这里的f8是float64的意思
字符串转时间格式,错误强转
dataDF.loc[:, "销售时间"] = pd.to_datetime(dataDF.loc[:, "销售时间"], errors='coerce')
根据时间计算天数
daysI = (endTime - startTime).days
业务指标
月均消费次数 = 总消费次数 / 月份数
月均消费金额 = 总消费金额 / 月份数
客单价 = 总消费金额 / 总消费次数
消费趋势
常见画图属性设置
绘图时防止中文报错
-
from pylab import mplmpl.rcParams['font.sans-serif'] = ['SimHei']