摘要: 这次总结下维度建模的形式:星型建模,雪花建模,星座模型 (维度建模不需要数据产品去实施,但是需要了解) 先说下两个概念:事实表,维度表 1. 维度表(dimension) 比如"昨天早上我在TB使用了50元购买了一个鞋子"。那么以购买为主题进行分析,可从这段信息中提取三个维度:时间维度(昨天早上), 阅读全文
posted @ 2019-05-06 15:09 codeWan 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 说下自己的理解: 数据仓库是分层的,通常情况下都是进行三层建模(当然也不是绝对的)。 例如上次说的商品订单数据表,表字段可能有非常多个,但是我们使用的时候可能只用到UID,PayTime,CreateTime, PayMoney,等字段。这个过程需要不断的过滤。每过滤一层就需要在新的一层储存一次。类 阅读全文
posted @ 2019-04-23 11:28 codeWan 阅读(2131) 评论(0) 推荐(0) 编辑
摘要: 通常指标的搭建需要建立在埋点方案之前,属于自上而下的流程。我们会经常探讨一个问题,部署后如何进行数据埋点?如何制定埋点方案?需要埋多少个点?埋点是在明确自己指标体系后,根据该指标体系来制定的实施方案。明确需要分析的指标后,根据指标制定相应的数据埋点方案,比如表单的电话字段要埋点,并且要获取到相应的事 阅读全文
posted @ 2019-04-16 14:45 codeWan 阅读(1431) 评论(0) 推荐(0) 编辑
摘要: 今天总结了下我司的一套数仓体系流程: 这是目前自己总结出来的大致流程,作为笔记。 里面的从数据源抽取,数据存储,数据建模,数据仓库分层分线,ETL,以及最后输出的数据应用将另外作为单独的笔记写。 再次强调本笔记是以产品人员的角度进行编写并非专业技术人员,如有错误请指正,本人也会进行修改 阅读全文
posted @ 2019-04-11 19:06 codeWan 阅读(508) 评论(0) 推荐(0) 编辑
摘要: 想要做数据,首先得有数据。对于数据分析来说,数据分析之始在于数据之源。 数据的来源通常分为: 1.内部数据:web日志,用户行为数据,业务数据,遗留系统数据.... 2.外部数据:调研,爬虫,导入数据,同行内部数据.... 起初公司数据埋点这块是用的百度移动统计。但是不能结合电商的业务数据,各个路径 阅读全文
posted @ 2019-04-02 14:35 codeWan 阅读(751) 评论(0) 推荐(0) 编辑
摘要: 本文以实际工作经验为实例,与大家一同谈谈数据仓库中的架构。 首先在说下数据底层的架构是大概怎么样的,在实际的业务需求当中,都是基于这套架构围绕的。 1.为什么要搭建数仓? 数据仓库其实也是数据库,和数据库的功能都是致—的都是为了存储数据。 那么公司在什么情况下需要搭建数据仓库呢? 当企业发展到一定的 阅读全文
posted @ 2019-04-01 12:00 codeWan 阅读(633) 评论(0) 推荐(0) 编辑
摘要: 为了记录自己的产品生涯,写下一些工作上的总结和心得。 (其实是怕自己人老多忘事O(∩_∩)O,找个地方记录下来) 产品的道路还有很远的距离,如今的互联网紧紧靠一款产品就可以获得成功的年代已经不复存在。 在产品的领域上已经细分出了各类产品,需要先专研深度才能拓展宽度。 为此写下数据产品的相关知识和个人 阅读全文
posted @ 2019-03-28 15:12 codeWan 阅读(197) 评论(0) 推荐(1) 编辑