随笔分类 - 数据分析
摘要:1、数据仓库概念与用途 数据仓库(Data Warehouse,简写DW)是一个数据库集合,存储大量的数据,主要为企业撰写分析报告与决策做支撑,对多样的业务数据进行筛选整合,为企业提供一定的BI(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。 数据仓库的输入方是各种各样的数据源,最
阅读全文
摘要:第三章《数据分析实战》--第三章 python实现主要利用分组统计分析了企业某游戏的销售额下降的主要原因。 这一章主要利用交叉列表(或叫作透视表)的方式来剖析企业用户数量减少的原因。假设是因为某个群体的用户锐减导致当月用户比上个月的用户数少,因此主要利用python中的pandas、matplotl
阅读全文
摘要:在商业数据分析流程中主要介绍分析流程以及每个过程的具体含义。这一章主要利用合并汇总来剖析企业销售额下降的原因。主要利用python中的pandas、matplotlib模块完成书中分析。 1、读取数据、合并数据 可以采用如下方式先设置工作路径至数据表放在位置,然后利用 os.getcwd() 来查看
阅读全文
摘要:数据分析大体上的分析结构如下所示(分析流程图如下所示): 首先,需要对现状和预期有一个很好的把握。其次,弄清现状和预期之间的差距,并调查导致差距产生的关键因素,即发现问题。这样的因素可能很多,所以要收集数据和加工,并在此基础上进行数据分析。主要是挖掘出导致此问题发生的关键性因素,然后综合考虑时间成本
阅读全文