数据中台

数据中台

1. 专有名词解释

  1. 业务过程:

    • 指在业务中发生的最小单元的行为或事务,不可再拆分事件,比如创建订单,浏览网页等等。业务过程产生的行为明细, 比如支付了一笔订单,浏览了某个网页,最终都会汇集到事实表中,而大部分情况下,事实表都会聚焦于某个特定的业务 过程。
  2. 原子指标:

    • 原子指标是对指标统计口径、具体算法的一个抽象
  3. 业务限定:

    • 在进行数据分析时,有时需要根据业务规则来定义一些限定条件,以此来过滤出符合条件的记录。比如要统计【PC端访客 数】这个指标,则需要先创建【PC端】这个业务限定。后续,这个业务限定可以用于其他相同规则的指标定义,比如
      【PC端浏览次数】等。
  4. 派生指标:

    • 派生指标即常见的统计指标,为保证统计指标标准、规范、无二义性地生成,基于四部分生成:原子指标(明确统计口径, 即计算逻辑)、业务限定(统计的业务范围,筛选出符合业务规则的记录)、统计周期(统计的时间范围,比如最近一天, 最近30天等)、统计粒度(统计分析的对象或视角,定义数据需要汇总的程度,可理解为聚合运算时的分组条件,粒度是 维度的一个组合,比如某个指标是某个卖家在某个省份的成交额,那么粒度就是卖家、地区这两个维度的组合)。
  • 逻辑架构

e6c9d24ely1h3f0x1uewnj21fu0pkn0v.jpg

  • 指标体系生成

e6c9d24ely1h3f0yclb62j21eo0ky77t.jpg

原子指标+统计周期+统计粒度+业务限定=派生指标

2. 数据中台建设方法论

​ 企业的发展,往往伴随着业务更多元化,而与此同时企业在积极推进业务数据化,因此越来越多的企业伴随着各个垂直业务的发展,形成了一个个垂直的数据中心,如何打通这些数据并且以统一的标准进行建设,以达到技术降本、应用提效、业务赋能的目标,是众多企业面临的问题。阿里巴巴提出的数据中台模式正是为解决这些问题而生,并通过实践形成了统一全域数据体系,实现了计算存储累计过亿的成本降低、响应业务效率多倍提升、为业务快速创新提供坚实保障。以下将以OneData、OneID、OneService三大核心方法论介绍数据中台的理念。

  • OneData
    • 数据标准化:数据规范定义从业务源头标准化;
    • 技术内核工具化:规范定义、建模研发、调度运维;
    • 元数据驱动智能化:从半自动化飞跃到智能化规划计算和存储。
  • OneID
    • 技术驱动数据连接:基于超强ID识别技术连接数据;
    • 技术内核工具化:超强ID识别、高效标签生产;
    • 业务驱动技术价值化:从孤岛变化到高质量数据进化到高价值数据。
    • OneID技术在业务中的主要应用于消除数据孤岛、提高营销触达、精确人群圈选以及360客户特征分析等四大主要场景。
  • OneService
    • 主题式数据服务:主题逻辑表屏蔽复杂物理表;
    • 统一多样化数据服务:一般查询加OLAP分析配合在线服务;
    • 跨源数据服务:屏蔽多种异构数据源

posted on   wa小石榴不甜wa  阅读(31)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示