于数据分析的态度,有几句牢骚要发泄一下,纯属这几年工作的个人心里感受。
面试后的感想
这个周末我一直在面试,总共三十多人,只有一半能到我这一关,不管是工作了几年的,还是一点工作经验都没有的,不管是名牌大学的还是一般学校的,他们对数据的态度都让我有些失望。
我问他们,假如我是京东商城的CEO,周一早上你要给我看上周的三个数据,你会选择什么数据?
几乎所有的人没有1秒就回答,比如流量、转化率、交易量等。
我接着问,你听清楚我的问题了吗,我说是给CEO看的。接着大部分人会倒抽口气说,也许CEO不会关注这么细节的数据,那应该是XXX数据了。
接着我又问,我说的是上一周情况,你注意到“周”这个时间段吗?接着大部分人又会恍然大悟似的说,是啊,周和月应该是不一样的,那应该是XXX数据了。
最后我问,这是给京东CEO看的,不是给凡客CEO看的。这个你考虑到了吗?这下所有人都愣在那里了。
结束时让他们给自己打个分,所有人给自己打分都打得非常低,最高分也是六七分(满分是10分)。
我问这4分去了哪里啊,他们总结了三个原因,一是没想到看数据的人是CEO,二是不明白京东,三是对数据不够敏感。
我并不是要拿这个问题来难倒他们,他们的答案也没有对错之分。在提问中间我给了他们三次机会,提醒他们可以问我问题,还要注意问题的要素。我考量的并不是他们给的答案,只是想看一下他们对于数据的态度和思维。是不是非常尊重数据,懂不懂得把数据和商业联合起来思考问题,这些在我看来是一个优秀数据分析师具备的基本条件。对数据没有热情和信仰,很难当好数据分析师。
面试的不满意让我想起来前段时间有人在微博骂艾瑞说的B2C转化率太不靠谱这件事情,也有人说转化率不应该是这样算的,不知道多少个专家在这个坑里面倒下去了。我觉得这个东西挺有意思的,的确是如这个人说的一样,不知道多少人掉到坑里还不自知:大家拿着转化率来谈东西,但却没有人问是哪种转化率,分子是什么,分母是什么。你说一个转化率,我说一个转化率。市场部门说一个转化率,网站运营说一个转化率。但是大家说的转化率到底指什么,很小人刨根问题过。而且,我们是用转化率来做什么决定?不然只光秃秃地说一个转化率又有什么实际意义?
怪异的是,如今的网上零售,好像不说数据就不专业,但是真的尊重数据、把数据当做科学的人却没见几个。
当然,这不是某个数据分析师的错,而是整体环境造成我们的数据分析师很难做到这一点。根据这几年的工作经历,我觉得毁掉一个数据分析师对数据的尊重其实很简单,“杀手”随处可见;同时,也只有真正体验到数据奇妙和甜头人,才会对数据有近乎炽热的信仰。
毁掉分析数据态度的三个常见原因
首先,大环境不尊重数据,尤其是老板的态度。如果数据分析师只要随便给一个报告就行,数字多一点和少一点,大家也是一笑而过,并不会追根到底,那么很难让数据分析师以严谨的态度对待数据。
例如,国内这几家数据分析机构,基本都在着急扩张行业,争着占领行业,对于其推出的数据有多精准却不那么在意,所以艾瑞的数据最近才会经常被人说“不靠谱”。
数据分析,今天做得不准,明天再改是没有用的。比如艾瑞,如果数据不稳固,抢着做很多行业,这是不靠谱的做法,指不定哪天砸了自己的牌子。
有人和我提过FACEBOOK数据分析师为什么那么牛,因为他们不觉得数据分析是一个苦事,十几个人在一个房子里把数据分析当做一件很开心的事情来做,数据分析对于他们来说是在追求科学。
第二,好的数据分析师需要一点天分,同时也需要高人点拨,但是电子商务这个圈子,真正懂数据分析的人不会超过10个,所以一般人很难取得真经。这和信仰一样,没有师傅领进门,难度也会大很多。
我回顾自己从微软到易趣,再从敦煌到支付宝,在数据分析上有一次长足的进步,得益于从两位老师的身上得到了许多启发。一位是亚马逊的首席科学家韦思康,曾经,我告诉韦思康,KPI报告显示敦煌网需要4秒钟,他立马让我叫来做技术的同事(他要听到一线同学的反应),问这个4秒钟怎么测算出来,是美国人打开用4秒钟,还是英国人打开用4秒钟,用的是甚么Browser等等。这个4秒钟和商业价值(例如交易量)有关系吗?我当时很触动,连这么一个很基础的数据,他都是以求证的心态来分析的。更令我印象深刻的是,只请他当敦煌网顾问半天,按照他的工作经历来说,随便忽悠我半天是很容易的事情,但是韦思康非常严谨,先是以一个普通人的身份花了半个小时在敦煌网买东西(坚决要真实付钱),切身体会敦煌网的用户体验,然后也不先看数据,而是先问很多能更了解敦煌网的生意形态的问题。讲真他的问题比很多投资分析师来得专业。而现在许多数据分析师,包括当时我自己,只看数据就开口说问题,不深入去体会公司的商业形态。
韦思康告诉我数据是一种态度,让我明白做数据的人就是要全身心投入,好像一种信仰一样,中间有许多路要走;而且,数据与商业密切相关,不能局限在数据的死角里。
另一位是清华大学的教授谢劲红,有一个夏天碰巧去旁听他的课,拿一堆的数据给他看,他一边看一边给我演绎他的思维,他可以很快在一堆数据找到他们之间的关系。后来我带着团队常常去清华找他聊,他教我如何看网络数据,用联动的思维来看网络数据。可以说是他启蒙了我用 “关系”的思维看数据。一听完就回到敦煌跑到敦煌看很多数据,发现了新世界。
以我自己的工作经历来举例,为什么我在敦煌的时候数据分析能力会突飞猛进,也是因为我在前两家公司只能看到一部分数据,而到了敦煌之后我爱看什么就看什么,受谢教授启发之后我更是天马行空地把营销数据、市场数据、财务数据、产品数据、卖家和买家数据等等联动起来看,这大大改变了我对数据的运用方式。
听起来简单做起来不容易
相比于高深的数据分析方法,好像上面说到的道理非常简单。但是在现实中,正如面试时候所看到的情况一样,多数人是在被提醒之后才恍然大悟。
说起来简单的东西,但是真正做到却很难。
包括我自己在内,真的每次都能保证每个数据来源是可靠的才进行演算吗?有时候也不一定。对于公司来说这种态度更为重要,今天的独立B2C天天说营销多么昂贵,可是他们的营销真的做到够细了吗?数据分析师有没有问过从门户网站的流量分为几个渠道,每个渠道的转化率又是多少?转化率的算法和数据收集准确吗?不能转化的用户从那来然後往那走? 用这个转化率来决定什么问题才有意义?
只是单纯地放一个数据出来,不是一个合格的数据分析师。
这就是我要说的几句牢骚话。