指标异动类问题分析框架 - 数据分析师面试题
引言
在数据分析面试题中,常常会出现这样的问题:
-
机票的成交转化率下降了,怎么分析。
-
航班公司觉得自己的某个航线经营状况不好,怎么利用我们的数据帮助他们找原因
-
销售量下降如何分析?
在这种题目中,面试官显然不希望得到一个“抖机灵”的答案,而是考察我们对指标异动的分析框架(思路),至于最终的原因,可能没有那么重要。
(PS:曾经我以为,如果面试官提到“大幅”这样的字眼,比如总收入/PV/GMV之类大幅减少,那么他会希望我分析出数据出错……这个先验假设后来被面试官证伪了hhh)
框架
分析框架主要分4部分:
- 明确定义
- 问题定位
- 指标拆解
- 原因分析
明确定义
私以为,做一个数据分析师很重要的一点,就是明确定义。在工作上,如果和业务方对需求的定义不统一,那我们的辛苦工作往往会白给;另一方面,在业务方提需求后,明确他们的核心诉求(真正的需求),也是很重要的。
比如引言中“航班公司觉得自己的某个航线经营状况不好,怎么利用我们的数据帮助他们找原因”的问题,我们就需要先明确“经营状况不好”的定义,是横比(其他公司、其他航线)还是纵比(历史经营状况)?
问题定位
指标拆解
- 分析框架:指标的公式拆解方法,将题中的指标拆分为一些指标的加减乘除。(二八原则:指标有很多种拆解方法,需要选择最“主要”的指标)
- 逻辑:上述拆解方法的局限性,如:
- 指出假设缺陷:在某些情况下,某种假设会使得数值有偏差
- 指出分布缺陷:在某些情况下,数据分布不均匀会导致数值有偏差
- 估算保守/激进:在这种框架下,是得到真实数据的上界还是下界
原因分析
主要分为外部原因和内部原因分析。
外部原因分析比较成熟的方法论是PEST,即政治、经济、社会、技术。“产品调研方法论”是参考产品调研的步骤(市场、竞品、用户调研),但这个方法论是我自己想的,不能算是成熟的方法论。
例题
- 网站销售额下降怎么分析
- 首先要定位到现象真正发生的位置,到底是谁的销售额变低了?这里划分的维度有:
- 用户(画像、来源地区、新老、渠道等)
- 产品或栏目
- 访问时段
- 定位到发生未知后,进行问题拆解,关注目标群体中哪个指标下降导致网站销售额下降:
- 销售额=入站流量*下单率*客单价
- 入站流量 = Σ各来源流量*转化率
- 下单率 = 页面访问量*转化率
- 客单价 = 商品数量*商品价格
- 确定问题源头后,对问题原因进行分析,如采用内外部框架:
- 内部:网站改版、产品更新、广告投放
- 外部:用户偏好变化、媒体新闻、经济坏境、竞品行为等
————————————————
原文链接:https://blog.csdn.net/u013382288/article/details/80417681
- GMV升了20%怎么分析
(我噼里啪啦分析了一通面试官笑嘻嘻地告诉我是数据错了,因为面试较紧张没有意识到这个问题,现在想想真是个大坑啊)
- 参考该面试者经验,应该先估算一下数字有没有问题
- 同样的套路:
- 两层模型:进行用户群体、产品、渠道细分,发现到底是谁的GMV提升了
- 指标拆解:将GMV拆解成乘法模型,如GMV=广告投放数量广告点击率产品浏览量放入购物车率交易成功率*客单价,检查哪一步有显著变化导致了GMV上升
- 内外部分析
- 内部:网站、产品、广告投放、活动等
- 外部:套PEST等框架也行,或者直接分析也行,注意MEMC即可
这一题要注意,GMV流水包括取消的订单金额和退货/拒收的订单金额,还有一种原因是商家刷单然后退货,虽然GMV上去了,但是实际成交量并没有那么多。
————————————————
原文链接:https://blog.csdn.net/u013382288/article/details/80417681
参考文献
https://blog.csdn.net/u013382288/article/details/80417681
https://mp.weixin.qq.com/s/gEHs2MWgBFn70StSmJD2tQ