大数据分析师到底在干嘛
为什么数据前面加个大?
不加大你不点,不加大不时髦,不加大不够大!
先从一个故事讲起,某养猪场厂长告诉A分析尸,我要看几个数据,你提取一下,一周后给我看看。
A分析尸列出:
猪总数10000、收入500万、净利润180万。
猪场老板一看,说:做的不错,A君好好干。
同样的问题,猪场老板给了B分析尸,B分析师很用功,分析公司今年的战略计划和年初定制的KPI目标,得知一个信号,猪场老板想降低成本、提高利润。
B分析尸列出了:
投入减少30%、毛利480万、净利增长50%
猪场老板一看,大喜,B君下月给你加薪。
同样的问题又给了数据君
数据君为了分析目标老板的目的,分析了去年他讲话的内容,也分析了他以往发给员工的邮件,甚至爬了猪总的微博、朋友圈得知一个信息,猪总其实不想继续增加扩张,想减少投入,提高净利,而且他对自动化喂养很感兴趣,写了几篇自己猪场和自动化喂养结合的文章,那么问题来了?我该如何思考?
先看看一般商业分析分析的路径,这个是麦肯锡的,很经典,但许多人知道,从来不按部就班来
首先从几个关键的业务目标出发:
罗列出这些目标影响的因素有那些?那么问题来了,因素他们多你如何去选取?
这时候就需要数据的支持,一般2种方式:
1、内部数据去推算,驱动因素影响的程度如何?这时候什么相关分析、AHP、回归分析等,给因素影响一个量化的标准,找出核心驱动因素;
2、外部数据,采用座谈,调研等方式确定公司各个业务部门对驱动因素的锁定。
其次就是验证推理提取核心的过程:
数据君整体分析了猪的结构,比如公母比例、幼猪和出品猪的结构变化,猪市场价格发展变化规律等,也从市场上分析了一些自动化喂养设备的投入,算出了ROI,这时候要系统性的去思考,各类对比和梳理。
这点大多数据分析轻车熟路,不做过多的阐述。
那么我发现了什么?
1、猪的繁殖有问题,公猪占85%,母猪占15%;
2、猪食的浪费问题,每天大概有价值10000大洋的猪食被当成垃圾请走;
3、猪市场的价格从10月开始一般上升趋势明显。
最后,我给猪总呈现了三个数据,这才是数据分析的核心:
1、繁殖问题,比例失调严重,紧缺母猪,现在(5月)母猪在市场的引入价格较低,建议引入500头母猪,这是第一个数据;
2、自动化喂养,采纳分析了ROI和采购价格的对比,预计采购某厂家的自动化喂养,1年后自动化喂养可以节约50w的成本,这是第二个数据;
3、从目前来讲,我们的成品猪较多,建议加大销售,腾出更多的地方买入幼猪,预估10月份将提升30%的净利,这是第三个数据;
猪场老板一看,目瞪口呆!!
数据君明天开始,你出任公司数据增长的业务负责人,薪资加倍。
以上的故事是我虚构的,可能语言组织和思路还不够严谨,我只是为了告诉大家一个道理,数据分析的本质是商业分析,而不是技术和工具问题,大数据时代,数据价值和驱动才是我们每个分析师应该关注的问题,从一个综合技能来看。
想成为一个出色的分析师需要N多技能,那些技能能让你快速实现自己的目标,这才是我们学习数据分析应该定位的,都要学习吗?
有了场景,有了明确的目的,接下来才是分析师们常用的三大利器:
1、对比,任何分析都是对比,对比就要讲究设计、平等、体系,才可比,换句话就是找“双胞胎”,才值得比,并列关系;
2、拆解,业务其实和数据分析一样,都是不断的拆分,拆的程度就是回答你的假设,许多指标都是分渠道、区域、用户类型、品类特征去拆,但拆要分主次,你拆和不拆对结果有什么影响要好好假设考虑,并列和主次;
3、构成,许多事情你明白他的构成你就更加清晰,好比你去饭店吃饭,有一盘菜,LP说真好吃,那你就会去研究这菜有什么成分,什么菜品组成,加工顺序如何,这就叫抛,彼此都是并列和流程关系。
不要迷恋统计学、工具、算法,就好比平均数可以看成是一组数据的综合衡量,而分析解读风险指数就是方差,当然你不懂统计学,什么数据都用平均数的话,你和统计局智商基本一样,要消化概念,看你如何把算法和规则转化为商业问题,这才是关键。