04 2019 档案
摘要:说下自己的理解: 数据仓库是分层的,通常情况下都是进行三层建模(当然也不是绝对的)。 例如上次说的商品订单数据表,表字段可能有非常多个,但是我们使用的时候可能只用到UID,PayTime,CreateTime, PayMoney,等字段。这个过程需要不断的过滤。每过滤一层就需要在新的一层储存一次。类
阅读全文
posted @ 2019-04-23 11:28
codeWan
摘要:通常指标的搭建需要建立在埋点方案之前,属于自上而下的流程。我们会经常探讨一个问题,部署后如何进行数据埋点?如何制定埋点方案?需要埋多少个点?埋点是在明确自己指标体系后,根据该指标体系来制定的实施方案。明确需要分析的指标后,根据指标制定相应的数据埋点方案,比如表单的电话字段要埋点,并且要获取到相应的事
阅读全文
posted @ 2019-04-16 14:45
codeWan
摘要:今天总结了下我司的一套数仓体系流程: 这是目前自己总结出来的大致流程,作为笔记。 里面的从数据源抽取,数据存储,数据建模,数据仓库分层分线,ETL,以及最后输出的数据应用将另外作为单独的笔记写。 再次强调本笔记是以产品人员的角度进行编写并非专业技术人员,如有错误请指正,本人也会进行修改
阅读全文
posted @ 2019-04-11 19:06
codeWan
摘要:想要做数据,首先得有数据。对于数据分析来说,数据分析之始在于数据之源。 数据的来源通常分为: 1.内部数据:web日志,用户行为数据,业务数据,遗留系统数据.... 2.外部数据:调研,爬虫,导入数据,同行内部数据.... 起初公司数据埋点这块是用的百度移动统计。但是不能结合电商的业务数据,各个路径
阅读全文
posted @ 2019-04-02 14:35
codeWan
摘要:本文以实际工作经验为实例,与大家一同谈谈数据仓库中的架构。 首先在说下数据底层的架构是大概怎么样的,在实际的业务需求当中,都是基于这套架构围绕的。 1.为什么要搭建数仓? 数据仓库其实也是数据库,和数据库的功能都是致—的都是为了存储数据。 那么公司在什么情况下需要搭建数据仓库呢? 当企业发展到一定的
阅读全文
posted @ 2019-04-01 12:00
codeWan

浙公网安备 33010602011771号