数据分析需要了解的 5 个分析周期
数据分析需要了解的 5 个分析周期
首先,为什么要分析数据?为什么公司变得越来越 数据驱动 ?
Fonte: https://www.datascience-pm.com/crisp-dm-2/
最简单的答案是: 以更明智的方式做出决定,减少猜测的数量 .这就是存在分析周期的原因,它指导这个过程从理解问题到衡量行动的影响,所有这些都在一个改进周期内。
所以让我们从定义开始。分析周期是: 整体方法,以确保不会忽视真正激发决策制定的数据分析的一些基本步骤。
不要被这里的“整体”这个词吓到。它们只是意味着该方法是完整的,没有简化,并且步骤是相互关联的。见 维基百科文章 了解更多。
最重要的是要了解为什么每个步骤对明智的决策过程都很重要。 ifood 数据分析主管 Lucas Pedote 表示:
“我们需要更少的流程和更多的心态”
也就是说,在公司文化中,而不是以自上而下的方式或仅通过流程,需要做出更明智的决定。因此,确保每个人都了解有必要经历周期的每个阶段以及为什么 使用数据进行决策更有意义 .一项必须融入文化但也需要领导者支持的运动,因为有继续猜测和猜测的倾向是正常的 照常营业 .
5个分析周期
首先我想介绍一个通用周期的步骤,然后强调 4 个周期:TERA、CrispDM、PPDAC、4ps 数据 做爱吃。
更通用的循环( 关联 ),它给出的概述是:
- 定义问题:它需要相关;
- 探索数据:描述性分析;
- 分析数据:发生了什么现象/行为;
- 预测与情景:探索未来的可能性;
- 行动:找到最佳解决方案,提出解决方案并付诸行动;
- 衡量行动结果:了解和更新模型或必要时进行的分析;
- 重复直到问题解决。
来自 Tera 的循环
Tera 技术学校数据团队在其分析和内部项目中使用的分析周期:
- 理解和定义挑战或问题;
- 构思:提出假设,定义问题;
- 来源和集合的定义;
- 数据清洗与分析组织:事前评估数据质量;
- 更深入的分析;
- 解决方案的设计和构建;
- 介绍调查结果和可操作性;
- 付诸实践并重复。
如下图所示,在步骤 2-5 的循环内循环是可能的,甚至是必要的。
PPDAC
经典循环,称为调查循环。它遵循以下流程:
Fonte: Wild e Pfannkuch (1999)
在葡萄牙语:
- 问题
- 普莱诺
- 数据
- 分析
- 结论
CRISP-DM
这是本文第一张图片中的周期,在数据科学周期中很有名。步骤是:
- 业务理解
- 对数据的理解(质量)
- 数据准备
- 建模:例如定义 ML 算法。
- 结果评估
- 重复直到解决
看 在这个网站上 这个周期的更多细节。
4ps的数据
ifood 数据分析团队使用的方法。四个P是:
- 问题:什么是疼痛?
- 潜力:收益是多少?将服务于优先级
- 产品:哪个是最好的交付物?什么最有用?例如:图表、仪表板或 ML 算法?
- 建议:那又怎样?采取什么行动?
结论
我试图通过展示 5 个示例并在更具分析性的文化中说明对这个工具的需求,来记录我对分析周期的了解。我们可以看到,它们都非常相似,只是关注点不同,更多的是调查、分析还是业务。
我希望它对你有用。我还有其他关于数据主题的文本,看看我的个人资料!
来源和灵感
文章:统计思维作为持续改进管理措施的支持, 关联 .
课程: 数据分析证书 da Tera
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明