数仓设计实战案例-偏业务型
一、 偏业务型数仓设计
背景:
opos互联网信用贷款行业,主要业务流程:
用户注册后,需要通过一系列的信息项认证.
信息项认证成功后,可以申请授信,然后由风控策略、模型给出信用评定,同时给予相应的额度。
用户获取额度后可以在平台发起贷款
贷款需再次通过相应的风控模型,评级通过后可以放款。
用户收到放款后,需要分期还款,每期还一定的额度。
设计思路:
1/ 梳理业务流程
2/ 梳理数据流
3/ 数据类型、存储介质、样例数据
4/ 需求--功能性需求、非功能性需求(性能、时效性)
1/ 梳理业务流程和数据流
风控审核: 有很多策略、模型在里面。包括爬运营商的数据等。 搞清楚风控的数据存在哪儿,特征数据存在哪儿
用户注册:填写什么样的信息,填写进了什么样的表
认证项、申请受信同样。
有时流程中还包括子流程:
2/ 需要采集的表
3/ 采集方案:
rdbms
log
nginx
mongo
表的数据量、每日增量、updated_time\created_time,自增id,源表的索引情况.
4/ 抽象维度设计,最后形成这样的模型:
然后再设计各层的表。
代码实现:
D:\数据仓库\PART3\11 偏流量型互联网行业数据仓库设计大数据仓库在数据化运营中的应用\5偏流量型互联网行业数据仓库设计大数据仓库在数据化运营中的应用.mp4
有些人,自甘堕落;有些人,即便身处深渊,也依旧笑容灿烂。