everda

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

背景

数据工作大概分为几大块:埋点,源数据同步&抽中间表,项目专题分析报表搭建,常规报表搭建,报表固化,分析工具化,建模挖掘,专题报告。
本文主要涉及报表固化相关内容。

tips

1.图表中,若有较多线条,
1).多指标且有同期对比数据时,不同指标使用不同颜色,不同期用深浅区分,时间近的深时间远的浅;
2).不同指标但同系列(例如漏斗关系),使用同一颜色同步深浅,大的深小的浅。
2.报表底层数据表建模中,
1).应从源数据中抽取最小粒度事实表,然后计算常用固定维度报表,当有自定义维度需求时重新计算生成;
2).当事实表的ID与维度关系随着日的变化可能存在变化时(例如变更城市),事实表中应携带维度值ID或维度表每日全量同步,取某时间段ID对应的维度值即取对应分区的维度表。
3.指标、维度和比较场景区分开,
1).指标和维度拆分原则
最基础的指标,比如登录和活跃(进行了某类行为)。
但在拆分维度和指标时,有时候需要考虑将某些底层维度+指标作为新的指标,而不是当做维度。原因是,许多维度下都会看这个维度的指标数据。
例如:认证用户登录数,认证用户活跃数;新增登录数,新增活跃数。
拆分出来的维度,是不经常用的,且尽量能拆分所有指标。
2)报表的两种展现形式
一般而已,报表的展现形式是,上面筛选一系列维度,下面展示一系列指标,这是最常用的。
但在使用中发现,经常需要了解一个指标不同维度的构成占比,或一个指标的环比同比、不同周期同期环比、与峰值(固定日/周/月)相比,系列指标转化率。这是我抽出来的称为“比较场景”的东西。
此时就需要另一种展现形式,即选择指标(可多)——筛选维度(可选)——选择比较场景。
当然,比较场景不太复杂可以在指标后面加列。

posted on 2019-02-19 16:46  everda  阅读(463)  评论(0编辑  收藏  举报