数仓主题域划分方法
一直以来主题域或者主题的划分各个公司的划分方法不一,其实适合自己企业的就是最好的,根据我对数仓的理解和经验来说,主题域或者主题的划分就是把物理建模的相关表进行分类管理,他们的划分过程可以按照下图的数据建模过程来划分,业务建模对应主题域的确定,领域建模对应主题(每一个主题基本对应一个宏观的分析领域)的划分,逻辑建模对应业务对象、逻辑实体确立,物理建模对应属性的确定,主题域和主题的划分不是一蹴而就的,可以先做明确定义的,其他的较模糊的可以后续迭代。、
主题域面向业务过程,是对业务的梳理,把相似或者相近的业务放到一个逻辑层面的集合,主题域是最高视角的蓝图规划。主题域的确定必须由最终用户和数据仓库的设计人员共同完成的,要严格遵守MECE原则,而在划分主题域时,网上主要有以下几种划分方法:
1、按照业务或业务过程划分:比如一个靠销广告点位的企业,主题域可能会有广告域,客户域等,而广告域可能就会有广告的库存的点位,销售分析、内部投放分析等主题,跟上图的业务建模类似,其他方法则不是。
2、根据需求方划分:比如需求方为人力部,就可以设定对应的人力主题域,而人力主题域里面可能就会有离职率分析,员工满意度分析等主题。
3、按照功能或应用划分:比如微信中的朋友圈数据域、群聊数据域等,而朋友圈数据域可能就会有用户动态信息主题、广告主题等;
4、按照部门划分:比如可能会有运营域、技术域等,运营域中可能会有用户留存分析、活动宣传效果分析等主题;
各个物理表的管理可以按照以下层级进行管理分类。