行业数据模型概述
分层数据模型
- 行业业务流程
- 行业主题域模型。在数据中台,主题对应一个宏观的分析领域,比如销售分析就是分析“销售”这个主题。联系较为紧密的主题的集合就是主题域。每一个行业都可以拆分为有多个(是个左右不等)主题域组成的主题域模型。
- 概念模型。在主题域的基础上,每个主题域内增加了实体以及实体之间的关系。
- 逻辑模型。在概念模型的基础上,增加每个实体的属性以及属性的约束。
- 业务分析模型,行业中重要的以及常用的分析方法与分析视角。在逻辑模型基础上,将业务分析问题转换为阿里云数据中台OneModle的派生指标,并进一步体谅出原子指标和业务限定。
- 行业应用场景。是基于以上模型的数据驱动场景解决方案。比如,推荐系统,用户营销等。
OneModle
OneModle是阿里云数据中台的核心方法论,是OneData的重要组成部分,知道指标的生产,管理与消费。所有的业务分析,应用场景落地到数据层面,都是一个个指标。企业的规模越大,业务越复杂,分析与应用所生产的指标就越多。OneModle可以保障海量的指标在企业全局层面取的统一的业务认知,避免重复建设,同时还使得指标的管理,查找与消费变得非常方便简单。
OneModle将最终用于分析与应用中的指标定义为“派生指标”,而派生指标可以拆解为四个子元素(以“最近一天每个门店的男性成交客户数”为例说明):
(1)原子指标,最基本的统计算式,没有任何其他的约束条件。例子中,“客户数”即原子指标。
(2)统计周期,时间范围约束,即例子中的“最近一天”。
(3)业务限定,业务范围约束,即例子中的“男性”,“成交”(需要有成交记录)。
(4)统计粒度,统计的颗粒度,即例子中的门店。
阿里云数据中台产品Dataphin是OneModle核心方法论的最佳实践平台。
参考资料:
http://dt-official-website.cn-shanghai.oss.aliyuncs.com/2487/5ffdf3d2-e57a-4842-b381-7f938fd3d98b/%E9%98%BF%E9%87%8C%E4%BA%91%E6%95%B0%E6%8D%AE%E4%B8%AD%E5%8F%B0%E9%9B%B6%E5%94%AE%E6%95%B0%E6%8D%AE%E6%A8%A1%E5%9E%8B%E7%99%BD%E7%9A%AE%E4%B9%A6.pdf?spm=a215hz.13439218.0.0.4fc229a2SeXrD6&Expires=1603878888&OSSAccessKeyId=LTAI4G2YETBBmJhTsKqaWrMR&Signature=tn3dYVA6aDUFTpvo03m6aAWy4Sk%3D
https://dp.alibaba.com/product/dataphin?spm=a215hz.13439507.0.0.4ef229a2bwMP88