好的数据体系,其价值体现在三个方面:
1、对数据团队,协助建设更合理的数据模型,节省更多人力和资源成本;
2、对业务团队,能快速响应业务需求;
3、对研发团队,明确数据出处,节省数据问题追踪时间。
数据体系从业务而生,又服务于业务,整个建设过程形成闭环:
业务理解--》数据指标体系--》数据采集--》数据清洗--》数据处理--》数据分析--》业务应用
1、业务理解是建设闭环链接点,是整个建设的基奠,后续的建设实现是工具,从中我们需要确定业务主题、数据主题、维度、指标、粒度、口径、可行性及其关联性;
2、数据指标体系是将业务关系图形化、结构化的一个过程,将业务诉求可视化,也是数据仓库建设之ER模型构造的基础。数据指标体系方法:
1)
3、数据采集、数据清洗、数据处理均是基于数据体系在物理层面实现的过程。其中,数据采集是一个获取数据维度、数据指标、数据口径的过程;数据清洗是一个保证数据完整性、准确性的过程;数据处理是一个保证数据准确性、一致性、及时性的过程,也是一个对数据体系物理模型构造的过程;
4、数据分析就是一个探索业务问题的过程,常用的分析方法:
1)对比分析法