大数据之BI开发 - 维度创建

 

 

    用多维数据库中的点,表示对业务的度量结果。在各种各样的市场销售产品,并不断对企业各类业务的表现进行度量。

 

 

术语汇总结合图

 

 

 

相关概念

 

  • 事实(表示某个业务度量):用于度量

存储组织机构业务过程事件的性能度量结果;每一行数据是一个特定级别的细节数据 ;事实表的主键,是外键集合(组合键) 。

 

  • 维度表:用于描述环境

通常有多列,或者说多个属性 。用于描述与“谁、何时、哪里、为什么、如何、什么”有关的事件 

 

  • 事实表与维度表的连接,遵循简单和对称性的原则。

 

 

  • 星型模型雪花模型:根据事实表和维度表的关系
    • 星型模型:

 

    • 雪花模型:

 

 

参考:

  • 大数据查询系统HiveImpalaSparkSQLKylin
  • 查询速度与被查询数据总量之间的关系:给定硬件条件下,假设数据总量为N( 1)查询时间随着数据量的增长而线性增长,O(N) ;2)查询时间不随数据量增长而增长,O(1) )
  • 大数据查询相关的关键技术:列式存储;并行计算;内存计算
  • SQL SERVER中ETL工具 - AS:项目中的Cube  https://v.kuaishou.com/bdZ6cy

 

 

 

posted @ 2021-03-13 21:11  划水De雁小明  阅读(681)  评论(0编辑  收藏  举报