从一道面试题谈数据推算方法

面试题目:
 
某城市有人口1000W,现某共享单车公司拟投放车辆,请问如何对单车的使用定价才能实现盈利?
 
注:不必纠结具体数值,主要考察推导思路。
 
继续往下看之前,请停下来思考5分钟,如果是你,你会怎么给出答案。
 
 
以下思路仅供参考:
  • 首先盈利不是一下子就实现的,需要时间周期;
  • 既然是盈利,则要收入大于成本,那么需要细分收入的结构和成本的结构;
  • 预估数据的时候要注意单位,有的是按人的,有的是按次的,有的是按天等等;
 
假设我们现在考虑实现盈利需要的周期是6个月(180)天,定价的方式是按每次用车的价格(价格恒定),那么要解决的目标问题是:
  1. 计算出每人单次用车的价格,设这个未知量为x;
  2. 该价格需要满足在180天内(以及其他设定条件下)实现盈利(收入>成本);
注:共享单车虽然收费会参考计时,但大多数情况都属于“起步价”。实际业务中会有月卡、季卡、年卡这样的付费,为了计算简便,计价方式统一为单次使用的价格。
 
接下来,我们考虑收入的组成结构:
  1. 车费,这个是收入的主要来源,设每人单次用车收费为x元;
  2. 广告展示也可以赚钱,这是次要收入来源,假设每1000次的曝光的广告收益为50元(CPM),每次用车都会有广告曝光;
注:标蓝的数据为假设的数据,一般来说这个值在最高值和最低值之间就可以(数值不要太离谱就行)。
 
再看成本部分:
  1. 单车成本,设为300元/辆;
  2. 运营成本,用户拉新、促活啥的也是要花钱的。假设半年内单客运营成本为100元/人;
  3. 人力成本,设产品、开发、运营、地推(包括线下维护)人员共60人,人均月薪为1.5W/月,即每月投入的人力成本为90W;
  4. 单车保养维护成本,设每辆单车半年的维护成本为100元(包括车辆损毁在内)。
 
理清收入和成本的结构以及对一些关键数据做出假设后,接下来要看看还有哪些数据需要补充:
  1. 该城市预计的用户总数,该城市总人口1000W,设符合用车条件的人群(16-60)占比为60%(这个数据也可以到国家人口普查数据上找);设上述人群中有互联网产品使用经验的比例为60%(可以查下中国互联网普及率);设有短距离出行需求的人数比例为15%(大多数时候选择的交通工具是地铁、公交、自驾);设该公司在该城市的市场份额为30%(假设要和ofo、摩拜3分天下,这里的30%是假设只有3家投放单车时的值),基于以上假设可以得到目标用户数为:1000W*60%*60%*15%*30% ≈ 16W人
  2. 投放单车的数量,一辆车可以对应多个人使用,假设人车配比为4:1(1辆车4个目标用户使用),那么要投放的自行车也就是4W辆(不考虑6个月内车辆的损毁情况,车辆损毁计入车辆维护成本);
  3. 每人每天用车次数,考虑大部分情况下都是上班或者下班,那就假设平均每人每天用车2次吧。
 
好的,数据准备齐了(虽然大部分的数据都是拍脑袋的·_·),接下来可以计算收入和成本了(注意是6个月内的哈)。
 
收入计算
  1. 车费收入 = 16W(用户总数)*2(每人每天用车次数)*x(每人每次用车价格)*180(天) = 5760x W
  2. 广告收入 = 16W(用户总数)*2(每人每天用车次数)*50/1000(CPM)*180(天) = 288W
6个月内总收入为(5760x+288) W
 
成本计算
  1. 车的造价 4W(投放车辆数)*300(单车造价) = 1200W
  2. 车的维护 4W*100(单车半年维护费用) = 400W
  3. 人工费用 1.5W(人均月薪)*60(人)*6(月) = 540W
  4. 用户运营 16W(用户数)*100(半年人均运营成本) = 1600W
6个月内总成本为 3740 W
 
6个月内实现盈利,那么有 (5760x+288) > 3740
这个不等式解出来可以得到x约为0.6元,也就是共享单车单次收费要大于0.6元才能在半年内实现盈利。
注:这里不考虑用户的逐步增长、车辆的逐步投放等数据会随着时间逐步变化的情况。
 
如果大家对数据预估方法感兴趣,可以阅读《超级思维:用理工科思维推算世界》(Aaron Santos)这本书。
 
上面案例中使用的方法被称为“费米估计”(Fermi-Estimates)。其核心思想在于将目标数值(Y)进行拆解,像搭梯子一样一步一步靠近(找到多个X来计算得到Y,把Y看做是关于X的函数)。
Enrico Fermi 是一位物理学家
 
使用“费米估计”时,需要注意的点:
  • “分步”的数值(X)可以来自于公开数据、行业报告、业务经验,或者拍脑袋(大胆地猜,只要数值不要太离谱就行,可以确定极大值和极小值,然后取个你认为比较合理的中间值就行),比如文中提到的“有使用互联网产品经验的用户占比”(笔者直接拍脑袋想的60%,和实际值差别不大);
  • 如何分步?可以参考“转化率公式”,就像俄罗斯套娃一样,一层一层地嵌套(对应一个一个的转化率,比如文中计算目标用户数量的操作)。也可以考察要预估的目标具有的多重属性,再求“不同属性的交集”(假设各属性间相互独立),先考察每种属性在总群体中的占比,然后同时具有这些属性的目标在群体中的比例,大致等于各个属性在总群体中占比的乘积(大差不差吧);
  • 数字可以进行简化,比如用较大的单位(案例中的人数单位为W),也可以适当对数据进行“四舍五入”(比如19W可以看做是20W),这样方便计算;
  • 对于最终结算得到的数值如果觉得大或者小了,可以回溯前面的“猜数”环节,看看是不是漏掉了某个“转化率”或者某个数值“猜”得偏差有点大了。

 

更多参考:

 

posted @ 2020-03-22 23:25  dataxon  阅读(507)  评论(4编辑  收藏  举报