大数据之BI开发 - 维度创建
用多维数据库中的点,表示对业务的度量结果。在各种各样的市场销售产品,并不断对企业各类业务的表现进行度量。
术语汇总结合图
相关概念
- 事实(表示某个业务度量)表:用于度量
存储组织机构业务过程事件的性能度量结果;每一行数据是一个特定级别的细节数据 ;事实表的主键,是外键集合(组合键) 。
- 维度表:用于描述环境
通常有多列,或者说多个属性 。用于描述与“谁、何时、哪里、为什么、如何、什么”有关的事件
- 事实表与维度表的连接,遵循简单和对称性的原则。
- 星型模型与雪花模型:根据事实表和维度表的关系
- 星型模型:
- 雪花模型:
参考:
- 大数据查询系统:Hive、Impala、SparkSQL、Kylin
- 查询速度与被查询数据总量之间的关系:给定硬件条件下,假设数据总量为N( 1)查询时间随着数据量的增长而线性增长,O(N) ;2)查询时间不随数据量增长而增长,O(1) )
- 大数据查询相关的关键技术:列式存储;并行计算;内存计算
- SQL SERVER中ETL工具 - AS:项目中的Cube https://v.kuaishou.com/bdZ6cy
记录有用的信息和数据,并分享!