逐步深入大数据设计的内核—数据仓库设计之多维模型设计和标签设计

步深入大数据设计的内核—数据仓库设计之多维模型设计和标签设计。

多维模型设计4步:确定业务场景、声明粒度、维度设计和事实表设计

大数据分析都是场景驱动,必须先明确场景。

粒度也就是场景中重点关注的实体,一般是原始主键或者维度联合主键,粒度设计合理,分析更加方便,架构调整越小。

(从这个意义上来说,OLAP设计是否技术架构是经常变幻的?就像场景是经常变幻的;通常OLTP一般技术架构变动比较少)

维度是看问题的视角,一般是离散的或者有限范围的,不变的或者不常变的,维度有层级,有属性,有描述。

事实表就是对粒度和维度的具体度量值,可以汇聚,钻取,切片分析。

标签分为事实标签、规则标签和模型标签。

事实标签感觉和度量是一回事。

规则标签是维度和度量结合一些判断规则生成的。

模型标签是通过属性+算法生成的。

——标签从客观到主管,静态到动态,越来越接近自然人的分析与判断,所谓人工智能可窥见一斑。

从纷繁复杂的各种概念中做做分类,厘清思路,梳理知识体系,更深入了解设计的真谛!

posted @   我爱编程到完  阅读(133)  评论(1编辑  收藏  举报
相关博文:
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端
点击右上角即可分享
微信分享提示