电商大数据——用数据驱动电商和商业案例解析
电商大数据——用数据驱动电商和商业案例解析(国内第1本将大数据与电商完美结合的权威之作!)
雪鹰传奇 著
ISBN 978-7-121-22556-7
2014年3月出版
定价:98.00元
360页
16开
编辑推荐
(1)《电商大数据——用数据驱动电商和商业案例解析》是国内第1本将大数据与电商完美结合的权威之作!本书是软精装版,提供200组客户、67个维度指标的核心网店数据资源供学习,书中案例在电商实战中已创造过巨大价值,淘宝天猫京东和独立B2C均适用。
(2)作者李必文是国内难得对电商与大数据均有深度研究的人,他是电商“数据驱动学”的倡导者和领跑者,更是资深电商经理人。
(3)如果你赞成本书一半以上观点,请勿错过《电商大数据》:
电商运营者,要更擅长根据需求“养”数据,数据“养”到一定程度,就会有价值。
电商大数据不一定量级要有多巨大,但数据维度要尽可能丰满。
商品打折优惠的幅度应大于11.6%,因为11.6%是一个阈值,为人类的最小心理感觉差。
50%的客户点击网站的次数都在3次以内。
快销品类目购买7次以上的客户便是绝对忠诚的客户。
新客户在收到商品后的10天之内二次购买的概率最高。
真正的大数据,不是噱头,更不是空心的概念,是“梦想照进现实”般的落地和丰厚的经验价值。
内容提要
《电商大数据——用数据驱动电商和商业案例解析》重点介绍了电子商务数据驱动的理论和商业案例。《电商大数据——用 数据驱动电商和商业案例解析》作者具有丰富的电商团队数据化管理与运营经验。全书共分三篇。上篇主要介绍了电子商务的战略、战术和数据驱动的思想,有助于 读者深入了解电商模式;虽然上篇皆是从宏观层面切入,但是基本都使用了定量的描述方式。中篇介绍了数据如何产生实实在在的生产力,主要包括建立数据化体系 的方法、广告的投放策略、艺术设计与数据驱动的融合。下篇是大数据案例,主要包括量化管理客服团队、大数据供应链管理、大型促销活动节点管理、客户“怪 诞”行为研究、CRM 及基于网络爬虫调整架上库存。
在《电商大数据——用数据驱动电商和商业案例解析》的目录中给出了200 组客户67 个维度指标的真实数据,这些源数据是非常珍贵的资源,为客户行为研究提供了不可或缺的基础资料。
《电商大数据——用数据驱动电商和商业案例解析》适合独立B2C 商城的高管、各种电商平台的店长和数据驱动相关从业者使用,也适合作为在校电子商务本科生和研究生的参考用书。
目录
上篇 电商战略战术
第1章 电子商务的战略解析 / 2
1.1 三言两语电子商务 / 3
1.1.1 电子商务的特质 / 3
1.1.2 电子商务的整合效应 / 4
1.2 电子商务的动态格局 / 4
1.2.1 草根淘宝平台动了谁的奶酪 / 4
1.2.2 猫与狗的战争 / 6
1.2.3 线下传统企业大鳄的电商梦 / 8
1.3 电子商务时代的品牌运作 / 11
1.3.1 电商品牌的定位 / 11
1.3.2 电商品牌的突围 / 14
1.3.3 品牌和平台的对立面 / 15
1.4 电子商务时代的“铁血”战争 / 16
1.4.1 电子商务时代的价格之战 / 16
1.4.2 电子商务时代的人才之战 / 17
1.4.3 电子商务时代的流量之战 / 18
1.4.4 电子商务时代的数据之战 / 19
参考文献 / 20
第2章 电子商务的战术解析 / 21
2.1 关于电子商务创业 / 22
2.2 电子商务10大营销学定律 / 23
2.3 电子商务的10大败局定律 / 31
2.3.1 正式运营已经错失销售旺季 / 31
2.3.2 人云亦云,草根小卖家没有清晰的电商运作策略 / 32
2.3.3 不注重商品品质和服务 / 33
2.3.4 企业发展过程中团队有分歧,红利分配不公平 / 35
2.3.5 过分烧钱砸广告,忽视PV转化率,经济入不敷出而死 / 35
2.3.6 缺乏高质量、稳健的供货商,供应链孱弱 / 36
2.3.7 舍不得投钱慢慢耗死 / 37
2.3.8 品牌定位模糊不清 / 37
2.3.9 实体企业向天猫商城转型缺少经验,用传统行业手段指导商城运营 / 38
2.3.10 电商一上马,业务全面铺开和团队组建冗余 / 38
2.4 电子商务的10大心理学定律 / 39
第3章 电商大鳄逐鹿中原、数据驱动主宰沉浮 / 43
3.1 你不知道的数据挖掘 / 44
3.1.1 数据挖掘原来是这么回事 / 44
3.1.2 孙子兵法曰:杂于利而务可信也,杂于害而患可解也 / 51
3.2 数据挖掘在电子商务中的多面性 / 54
3.2.1 数据挖掘在电子商务行业中广泛应用 / 54
3.2.2 数据挖掘是有巨大价值的,但结论常常是错误的 / 57
3.2.3 客观认识数据挖掘 / 59
3.3 电子商务数据挖掘的“AVSM法则” / 62
3.4 数据挖掘的工具 / 65
3.4.1 数据采集工具 / 65
3.4.2 客户端数据分析工具 / 66
3.4.3 客户端数据挖掘工具 / 67
3.4.4 数据存储——数据库系统 / 68
3.5 延伸阅读 / 69
3.5.1 谷歌与Facebook的数据挖掘之战 / 69
3.5.2 军事战略上的数据分析 / 70
参考文献 / 72
中篇 基础商业案例
第4章 搭建数据化体系 / 74
4.1 绘制销售图谱 / 75
4.2 数据化指标及体系 / 77
4.2.1 晴雨表体系的建立 / 77
4.2.2 晴雨表的解读技巧 / 80
4.2.3 组建流量漏斗模型 / 82
4.2.4 诊断流量黑洞 / 86
4.2.5 诊断流量骤变原因 / 87
4.3 数据分析入门案例 / 88
4.4 数据挖掘入门案例 / 93
4.4.1 漫话统计学 / 93
4.4.2 喜欢买连衣裙的客户比喜欢买卫衣的客户更有价值吗 / 94
4.5 数学建模入门案例 / 95
参考文献 / 97
第5章 广告投放策略 / 98
5.1 互联网广告的特征 / 99
5.1.1 定向性 / 99
5.1.2 强化品牌印象的利器 / 99
5.1.3 一把双刃剑 / 100
5.1.4 非强迫性 / 100
5.2 互联网广告的形态 / 101
5.2.1 CPC广告及“通货膨胀”/ 101
5.2.2 CPS广告及“高开低走”/ 104
5.2.3 CPM广告及“创意无极限”/ 106
5.2.4 硬广及“暴力拓展”/ 108
5.3 广告投放战略 / 111
5.3.1 广告投放预算 / 111
5.3.2 广告效果量化模型 / 113
5.3.3 投放策略确定 / 115
5.4 精准投放基础篇 / 118
5.4.1 分时段投放 / 118
5.4.2 分地域投放 / 121
5.4.3 分品类投放 / 122
5.4.4 关键词遴选 / 123
5.5 广告投放高级策略 / 124
5.5.1 CPC出价与点击率、转化率之间的理论数学模型 / 124
5.5.2 深度解读CPC与点击率之间的意义 / 125
5.5.3 CPC广告的三种平衡点 / 127
5.5.4 广告投放线性组合优化 / 130
5.6 广告资源的整合和管理 / 133
参考文献 / 135
第6章 数据驱动艺术设计 / 136
6.1 数据驱动与艺术设计漫谈 / 137
6.2 网站首页最优长度如何测定 / 139
6.3 网页的结构布局策略 / 140
6.3.1 经典的结构布局理论 / 140
6.3.2 站内搜索的设置 / 142
6.3.3 首页商品撤换的“ROI”原则 / 142
6.4 商品详情页的“倒三角形”结构 / 143
6.5 警惕搭配套餐的骗局 / 146
6.5.1 人类最小心理感觉差 / 146
6.5.2 搭配套餐的新陈代谢 / 147
6.6 关联推荐的设计 / 148
6.6.1 关联推荐的机理 / 148
6.6.2 支持度、置信度和提升度 / 149
6.6.3 小结 / 156
参考文献 / 157
下篇 大数据驱动
第7章 数据化管理 / 160
7.1 任何一个团队或项目不能量化就不能管理 / 161
7.2 客服团队数据化管理 / 162
7.2.1 客服团队排班设计 / 163
7.2.2 客服团队的绩效管理 / 163
7.2.3 客服团队忠诚度激励方案 / 170
7.2.4 客服团队数据化管理高级应用:测算咨询并发数 / 174
7.3 供应链数据化管理 / 177
7.3.1 供应链数据化管理的点和面 / 177
7.3.2 大数据环境下供应链管理的通路 / 179
7.3.3 商品结构如何布局 / 181
7.3.4 销量预测的三种最基本的方法 / 183
7.3.5 现货模式下的弹性补货策略 / 188
7.3.6 智能化仓库拣货路径的设计 / 191
7.4 大型促销活动促销节点的设计 / 198
参考文献 / 202
第8章 客户“怪诞行为”研究 / 203
8.1 商品预售是颠覆了零售模式还是电商之殇 / 204
8.2 客户手机号和电子邮箱里隐藏的秘密 / 206
8.2.1 手机号与客户购买力之间的关系 / 206
8.2.2 从Mail地址里窥探那些不能说的秘密 / 208
8.3 数学模型量化客户行为 / 211
8.3.1 幂函数解析客户流失概率 / 211
8.3.2 对数函数解析客户究竟会点击网页几次 / 217
8.4 “7次购物原则”与客户忠诚度 / 218
8.4.1 知识储备:条件概率 / 218
8.4.2 Logistic回归模型解析客户流失概率分布 / 220
8.5 客户生命周期贯穿销售始终 / 225
参考文献 / 228
第9章 客户关系管理 / 229
9.1 客户关系管理没那么简单 / 230
9.1.1 客户关系管理的生死穴 / 230
9.1.2 客户关系管理的流程 / 235
9.2 客户关系的五部曲 / 237
9.2.1 数据库的组建 / 237
9.2.2 数据库的加厚 / 243
9.2.3 数据库的标签 / 245
9.2.4 数据库的挖掘 / 248
9.2.5 客户关系管理的落地 / 250
9.3 与时俱进的客户关系管理 / 252
9.3.1 客户服务的类型 / 252
9.3.2 客户关系管理用好现代互联网新媒体 / 255
9.3.3 客户关系管理商业流小结 / 259
9.4 客户关系管理商业案例 / 262
9.4.1 用决策树为有价值的客户画像 / 262
9.4.2 基于神经网络建立客户流失预警机制 / 264
参考文献 / 272
第10章 数据驱动高级商业案例 / 273
10.1 基于网络爬虫技术架上库存调整项目 / 274
10.1.1 背景 / 274
10.1.2 架上库存调整的意义 / 275
10.1.3 调整方案的流程图 / 276
10.1.4 三言两语:网络爬虫是什么 / 278
10.1.5 架上库存调整临界点的设置 / 279
10.1.6 架上库存调整结果展示 / 280
10.2 淘品牌资本化运作所面对的局势 / 286
10.3 数据驱动小结 / 287
10.3.1 电商数据驱动团队组建 / 287
10.3.2 学好数据驱动的方法 / 287
10.3.3 实施数据驱动的四大障碍 / 290
教材习题 / 291
重要附录 神经网络训练和测试优质商业样本 / 295
精彩节摘
数据挖掘已经在商品数据化管理、各种网络广告组合优化投放、CRM(客户关系维护)和市场营销等领域取得了相当丰硕的成果,正在以不同程度地驱动让电商企业向前发展。下面罗列的是常见的一些案例,作为抛砖引玉,读者朋友可以先行独立思考。
1.通过 数据指标判断一个电商网站是否健康就好比去医院体检,比如抽血化验,血小板总数、白细胞总数、红细胞压积容量、淋巴细胞百分比、粒细胞百分比等项目数据就 类比于电商网站数据指标,通过指标就能判断网站是否运营良好,所以需要知道两类值:实际值和参考值。但是难点在于,如果没有足够的经验,往往很难将数据指 标与背后的问题一一对应起来,这就是所谓的“先验知识”。如果一个店铺或者电商网站(快消品类目)有较长时间没有上新,那么以下指标一定会下滑的是?
A.浏览回头率↓ B.访问深度↓ C.浏览回头率↓ D.访问深度↓
2.因为 某些商品(比如快消品中的真皮女鞋、羽绒服、皮草等)成本高、出货周期长或者其他原因,这些商品经常预售。某一销售旺季波段,凡是与预售商品一起下单的很 多数额巨大的订单都因为缺货而导致大批订单未能及时发出,用户体验及其糟糕(拆单听起来是个不错的主意,但是成本变高并且实践证明客户并不喜欢接二连三的 包裹陆续到来)。现在能做的无非是亡羊补牢的挽救措施,请你通过数据分析解决以下三个问题:
(1)请分析缺货产品的成分结构。经常会戏剧性地出现因为一个类似小吊带的小物件缺货而导致大批货物不能发送,如何避免?请给出建议。
(2)为了能给客户更好的体验,现在或许是唯一能做到并一定会起到显著效果的措施是什么?并计算成本有多大。
(3)预售商品导致不能发货的问题并没有完,还会衍生出其他问题。例如,某预售A商品与现货B商品被C客户同一天拍下并付款,但是当A商品到货后,C客户订单仍然不能发出,原因是原来的现货B被其他订单挪用,B商品也因为缺货而变成预售,无辜的C客户无奈只能一等再等。当然,接下来可能损失了一名C客户或者其身边的朋友。为了避免此种情况发生,请给出你详尽的数据支持方案。
备注:原始库存数据和订单数据此处略去。
3.一件女装刚刚上架,很多新客户一般不会轻易出手购买,请问大部分新客户的心理是在等待观望新品评价出来之后再购买,还是因为从众心理,等部分人群购买了才会出手。所以:
(1)请通过数据分析还原新客户在购买新品时的心态。对于新品或者新开张的店铺或网站,女人的哪种心态更多一点?
(2)运用此结论,如果你是一个女装主线品牌的操盘手,现如今欲创建副线品牌,如何操作才最可能成功?
备注:原始订单数据此处略去。
4.请你一口气列举出影响客户可能流失的40个数据指标用来组建客户预流失数学模型,且这些指标目前基于淘宝数据工具或者独立B2C网上商城运用GA(一种网站数据采集工具)并结合ERP系统都可以抓取到。如果该预流失数学模型用在精准会员营销方面,你将策划哪些营销方案?为了使客人最终成为忠诚度极高的客户,请给出你的连环精准营销方案。
5.在女装商品标题进行SEO的时候,常常会使用热词比如韩版和欧美等一些搜索量很多的词汇,显然热词会带来更多的自然流量。问题是:
(1)热词在提高流量的同时是不是对转化率也会有一定程度的提升,姑且不论提升程度的多寡,但是会有一定量的提升吗?请不要一拍脑袋就流利地说出答案,因为每个决策都会影响到隐性和显性的销售额。
(2)对于一个成熟的电商网站和店铺,热词有时候可能与品牌调性不合,如何权衡此问题?
备注:原始流量和销售数据此处略去。
6.现有一定量库存商品(女装类目),为了尽快释放出现金流,公司想把这批库存消化。如果你主持这件事情:
(1)你打算从什么角度来分析库存结构?
(2)按照优先级,哪些子类目的库存应该最先清理,依据是什么?
(3)通过对不同地域的客户群购买特征的数据分析,你能得到什么样的结论并基于此结论制定何种有效的清仓计划?
(4)为了防止库存积压的事件重现,请你通过数据分析,能否给出在订货时间节点和数量两方面的弹性补货机制,并依据女装的销售生命周期,在保证库存量和公司利润兼容的情况下,选择什么样的清货流程才最佳?
7.在女 装类目中(也包括其他服装类目),视觉效果表现往往需要借助模特去表现,因为服装只有穿在模特身上才能完美诠释神韵,但是模特是有生命周期的,而且品牌风 格的转变也是需要更换模特。在更换模特的时候,原来的女性客户往往表现出不买账抑或不支持的声音,而且通常反对声音都是相当的激烈。这是很正常的,风格转 型必然会遭遇阵痛,不可避免。但是,女人心理的天然属性意味着即使有再多反对声音,也会有噪音,也永远不能完全还原整个事件的真实状态。问题是,转型意味 着改变而不一定意味着朝好的方向改变。老板很纠结,在大批老客户反对声音中,无法拿捏准是不是应该坚持转型。
(1)你应该从数据的哪些角度分析模特转型是否成功呢?经过客观的数据分析结果表明,倘若模特转型是成功的,也给老板尽早吃一颗“定心丸”;倘若转型不成功,也给老板提供决策支持,及早防止老客户开始流失。
(2)衍生另一个问题。大家都在谈论“意见领袖”的作用,女 模特几乎每个女装电商企业都在用,从需求角度上说,一些成熟有财力的女装电商企业都希望得到在平民中有较高影响力和号召力“意见领袖”模特。问题是,“意 见领袖”发挥的作用究竟有多大有没有比较靠谱的方法分离出来以便进行合理的量化呢?比如请网络红人代言天猫商城,取得成功的可能性有多大?
(3)目前女性SNS(Social Network Site, 社交网站)分享做的比较优秀的平台有“蘑菇街”和“美丽说”。利用上面结论,请你预测一下,如果这两个平台上具有超高人气和众多粉丝的美丽达人自己开一个 跟她风格比较搭的网上小店,你觉得她市场号召力有多大,能不能快速地做起来(在启动资金完备但不是烧钱的前提下,且供应链基本顺畅)?说明:此问题伸缩性 较大,所以只要给出数据分析的思路即可。
8.以下问题稍微技术性强一点。快消品客人的生命周期通常服从以下何种分布?
A.幂函数分布 B.负指数分布 C.正态分布右半部分 D.不确定
9.新客户再次回头购买的概率比较低,假如目前只有20%左右回头。为了提升新客户的二次购买率,现进行新客户数据库营销。最简单也是最容易操作的是发放10元优惠券鼓励新客户感受二次购物体验。为了使客户对我们的优惠券保有量并不总是充足的(客户优惠券保有量过多对后续营销活动会有所钳制),优惠券有效期设置为一周。但是,实际测试的营销效果并不理想,优惠券使用率不到8%,尽管跟优惠券营销的老套过时有不小的关系,不过,这不是该问题需要讨论的内容。请用数据分析说明:
(1)影响优惠券使用率最重要的因子是什么?
(2)我们猜想,按照常理推断,刚刚进入网购的客户(这可以从淘宝或者独立B2C商 城的信用等级来大致区分,比如一颗心的客户与一黄钻的客户相比,前者网购时间大概不会太长),应该更在乎优惠券,而网购达人应该觉得优惠券不是很稀罕。请 从数据分析的角度来预测,如果新客户营销方案改成二颗心以下(含两颗心)的客户使用优惠券营销,而两颗心以上的客户改用其他更有新意一点的营销方式,那么10元优惠券对两颗星的新客户刺激购买是否有显著提升作用呢?
备注:原始优惠券、客户等级数据及订单数据此处略去。
10.客户沉睡周期如何划分才有利?如果周期过短,也许会打扰到客户甚至引起客户逆反心理从而造成了客户永久性流失;如果周期过长,对于沉睡客户的唤醒是极为不利的,其可以唤醒的概率会伴随周期的变长而急剧衰减。
数据挖掘显然不是万能的。比如在广告投放方面(任何一个规模公司,不论去梅地亚中心进行广告竞标,还是在各大门户网站硬广投放,广告费用都是不菲的),希望能对目标人群进行精准投放。地毯式的广告会吸引人的注意,但是未必会引起别人的兴趣。假设我们经过数据挖掘得出30~45岁的年轻高级白领女性是我们的潜在客户,并且经过进一步分析知道她们经常登录的社交网站及习惯出入的公共场合。于是,我们依据数据挖掘的信息实施广告的定点投放,但是发现目标受众的响应概率只有15%左右。高达85%的受众人群对广告置之不理,看起来是一件相当沮丧的事情。换句话说,对大部分的个体消费者来说,数据挖掘的人群定位差不多都是错的。
尽管数据挖掘不是很精确,但数据挖掘是有价值的。虽然预测出来的受众人群只有15%产 生了效果,但是相比没有使用数据挖掘,凭经验或者漫无目的地全方位的广告轰炸,效果要好得多,就像现在推销保险如果继续采取挨个电话推销,很容易把客户打 死,下次再想把保险推销出去就会变成几乎不可能事件,所以,讲究策略很重要。没有方向性的广告实际上就是广告的随机播放,碰见目标用户的概率极低,可能只 有2%的客户响应。从商业角度来解析,数据挖掘过程换来15%的响应客户是非常值得的。当然,从市 场营销的另一个角度来说,正是因为数据挖掘在有些时候不是很精准,广告投放具有一定的随机性,才不会失去拓展市场的机会。所以,我们在广告有效投放的时 候,也需要一些不确定性,保证吸引目标群体的同时,也教育或者培育可能是我们的潜在客户使之覆盖面更广。最好的比例可能是希望广告吸引来的80%是我们现在的客户,20%是未来客户,“二八法则”,总之为未来潜在的客户也预留覆盖的机会。假如有一份广告,95%的客户都产生了购买行为,从眼前来讲,这份广告是异常成功的,其实不然。从长远目光来看,这份广告的受众面过于狭窄。
图3-10就是根据多次试验条件下,得出某项活动的人群响应率。我们针对活动可能吻合的消费人群进行评级,越评级高的对活动响应率越高。
一般情况下,在广告投放之前,都会进行必要的评估。比如在大型门户网站上投放广告,我们可以根据已有的数据模拟一下广告的效果,比如,用与CPC进行比较,看看广告是否值得投放。其中,UV是网站访问人数,CPC是广告每次点击花费的成本。
数据挖掘工程师在某种意义上讲,他们是电商操盘手的“军师”。数据挖掘最重要的支撑点在 一个“挖”字。何谓“挖”?就是凭经验和肉眼看不出来的现象和行为规律,通过数据分析展示出来。所以,数据挖掘一定是预先没有的结论而通过各种方法的分析 从数据中提取出来的,而不是一眼看出来的,比如在电子商务数据挖掘关联推荐的案例中,作者曾经碰见通过挖掘3C商品(Computer、Communication、Consumer Electronics) 订单数据来找出关联商品,不过不幸的是,得出的结论常常是尴尬的,比如得出这样的结论:经过对海量数据进行挖掘,发现手机和手机壳的关联性特别大。实际 上,得出的关联销售结论是正确的,只是用处不大,因为该结论再现了商业常识。换句话讲,从数据里挖出来的结论引导公司运营,而不是用肉眼看出显而易见的结 论,然后罗列数据去佐证它,这中间的逻辑关系不能本末倒置了。数据挖掘最肤浅的表现是所从事的行业背景与统计学技术之间找不到挈合点,更甭提大而化之地、 夸夸其谈所谓的“数据驱动运营”了。
我们还要警惕数据的“小数定理”,这也是数据挖掘的局限性之一。与之相对应的,从统计学 的角度已经知道,“大数定理”告诉我们,样本越多越会接近事情的真相。但是,很多时候在进行数据挖掘的过程中,纵然样本很多,技术使用非常高深,还是会出 现情绪性的偏差,数据挖掘的结论几乎总是收敛于50%左右,这让数据挖掘陷入困境。比如在女装电商公司,为了减少库存的压力, 常常采用“预览”策略,就是客户可以对商品进行收藏和评价,公司会根据女性客户“民意”走向来大概预估商品的阶段性销售数量。但是,经常事与愿违,之前看 起来喜欢该商品的女性客户等商品真的上架销售之后,很可能不再买。这样案例还有很多,不管采集的样本容量有多大,结论总会出现不可控的情绪性偏差,尤其在 女性各项消费领域表现尤甚。因此,尽量缩短女性客户的思考时间有利于提升商品转化率(注意:“思考时间”跟“停留时间”是截然不同的两个概念,不要混 淆)。
另外,正确运用数据挖掘模型,否则就不能达到预期目的。在电子商务行业会经常使用RFM模型来进行会员营销。对于CRM维护,作者看到近年各种CRM软件如雨后春笋,都在抢占市场。巧合的是,每个CRM软件里面似乎总有一个叫RFM模型:最近一次消费时间(Recency)、消费频率(Frequency)、消费金额(Monetary)三个方面。这个RFM模型最早来自美国零售行业,被我们电商业界移植到国内电商CRM环境下,不仅对客户群体的划分粗糙,而且是水土不服。看起来有经典理论作为支撑,宣传起来也有理有据,但是实际效果定然不痛不痒。数据挖掘会经常用到数据建模,比如这个RFM模型用于对流失客户的聚类上,除了R/F/M要素之外,仅对于淘宝卖家(其他独立B2C网上商城类似)来说,买家中差评和投诉的频率一定直接影响到客户是否流失但无法体现在RFM模型里。至少,这个经典模型需要修正。我们看一个运用人工神经网络基于RFM模型来预测客户的留存问题。图3-11是神经网络的结构,最上层四个点分别表示R/F/M三要素和中差评次数这四个指标,中间一层是神经网络的CPU处理器,最下面一层是预计留存的结果(继续保留或者流失),这里面还耦合了很多高新技术,就没必要说明了。我们训练客户样本数为46053对,计算机经过三天三夜的不间断计算,样本预测结果如图3-12所示:尚存客户(没有流失的客户)的预测准确率47%,流失用户的预测准确率70%(该公司的客户回头率极低,为15%~20%之间波动)预测效果非常差,通过此案例,我们至少得出四方面的启示:
·RFM模型虽然经典,但是并非放之四海而皆准,需要结合实际使用情景。
·数据分析样本的选择特别重要。
·并非技术越高级、越华丽,得出结论就越有价值,实用性总是第一位的。
·再现了“小数定理”,虽然样本较多,技术很高,但是预测结果很差。
作者简介
雪鹰传奇真名李必文,国内电商“数据驱动学”的倡导者和领跑者,数据分析“AVSM法则”的创始人。知名电商经理人,具有丰富的电子商务一线从业经验;国内两家知名电商商学院量化管理和数据化运营方向讲师;北京某著名线下品牌熟女皮草电商项目战略顾问。
目前在上海陆家嘴一家国资背景的金融集团管理层任职,主要研究方向是大数据、BI(商业智能)和互联网金融。作者邮箱:math114@163.com,有关本书中的问题可以咨询作者。
前言
当今社会,经济形态和商业文明已经进入整合阶段,比如电商耦合了物流、零售、支付手段、 互联网等载体,各种载体产生的数据汇整在一起便形成“大数据”。大数据的故事、传奇、思想和成功案例,我们已耳熟能详,在本书中亦有大量电商案例介绍。真 正的大数据,不是噱头,更不是空心的概念,是“梦想照进现实”般的落地和创造丰厚的经济价值。
商业中的大数据
“大数据”若按照学术界的严格定义,其量级通常不低于1PB(也就是1024TB)。电商各种数据源量级巨大,但是相对粗糙、噪声高,甚至部分是流水,经过数据的筛选、洗涤、转换、聚合等动作之后,“大数据”往往会变成可供商业分析和挖掘“小数据”。所以,大数据是相对的。
目前,尽管大数据如火如荼,但是商业模式和盈利模式并不清晰。能算得上真正的“大数据” 量级同时完全由大数据创造的巨额经济价值足以养活整个公司的企业,在笔者看来,仅网络搜索巨擘谷歌和百度两家。而大部分商业场景之下的基于数据的决策倘若 按照“大数据”的学术定义,皆称不上大数据,但是数据化决策和管理屡见不鲜、无处不在。所以,商业中(包括电商行业)的大数据一般指的是数据维度比较丰满 且数据观测数在1000万以上的规模。
数据驱动电商
电商企业的兴衰荣辱总能最先在运营数据方面窥见端倪,数据亦能在量化层面揭橥电商生态的进化与成长。电商群雄逐鹿中原,数据驱动主宰沉浮。
数据驱动跟数据分析、数据挖掘和数学建模有本质的区别,后面三种皆侧重数据技术层面,没有考虑到商业流程和使用者。数据驱动的核心是数据创造生产力。笔者不论在商学院传道授业解惑,还是在企业的管理实践中,总是不停地重申:数据只有产生价值才会有价值。
数据与商业结合,懂商业才能谈数据分析或挖掘,两者皆成为业界共识,但是如果说数据撑持商业则过于笼统,没有说到点子上,数据应当是作用于“商业决策点”,哪里遇到决策的拐点,哪里便需要数据,并不是商业和商务中方方面面都离不开数据。认清数据在商业中的角色也很重要。
本书由来
笔者曾一直想写一本电子商务数据化管理和数据化运营方面的书。数据驱动主题的电商教材并不多见,源于一线的真实、有效的商业案例则更少。笔者浸淫电商行业多年,非常希望能把自己团队的数据化管理和运营经验编撰起来,汇编成一本书,让后来者稍有借鉴。
约莫大半年前的一天,电子工业出版社的张彦红老师通过阿里巴巴公司的朋友找到笔者,表明 希望出版数据电商书籍的意向。我们不谋而合,笔者非常荣幸地接下了这本有关数据电商的书,并下定决心拼尽全力、尽笔者所能写一本像样的书。但是,动起手来 并不容易,认认真真写一本书是一件很苦的事情,也是一件很痛苦的事情。笔者给自己制定的写作计划是半年时间,如此速度还是基于现已掌握丰富写作素材的基础 上。于是,白天上班,夜晚和周末推掉了一切应酬,笔耕不辍,有时候为了确认案例中的数据是否靠谱,便要推敲好几天。终于,这本书如期跟大家见面了。
本书着眼于电商数据化的思想,尽量弱化各种深奥难懂的技术细节,但是如果全是思想就流于 泛泛而论、空洞无物,内容略显肤浅,而且不容易深入掌握商业案例的本质。所以,笔者对内容结构的部署也做了一番精心编排。全书分成三个层次:第一个层次着 眼于电商的思想,商业模式是电商从业者必须了解的;第二个层次是基础性的数据驱动方法和商业案例;第三个层次是大数据方面的高级应用,读者在这个层次中不 仅会感受到大数据的思想,同时笔者会立体呈现完整的大数据案例。为了让本书内容深入浅出、形象生动,对关键性的技术以“知识小卡片”的形式展现给读者,期 望能达到“知其然并知其所以然”的效果。
本书特点
这本书特色鲜明,纵观全书有以下一些特点:
(1)不论是独立B2C还是阿里系电商都通用。书中大量的商业案例既有来自独立B2C的,也有来自淘宝、天猫、京东等平台的。笔者试图把数据驱动体系纳入到整个电商生态中去阐述。
(2) 丰富详实的真实商业案例。笔者一直以为,只有真实、有效的商业案例才能对读者具有正确的导向性。原创、丰富的案例是这本书最鲜明的特色。例如为了使供应链 数据化管理的数据源更加合理,笔者仅清洗大量数据就花费了两周左右的时间。每个案例的遴选,站在笔者的角度上,都来之不易。
(3) 侧重数据思路的设计。在写作过程中,一直有一个问题困扰笔者,就是不断地问自己:这本书的价值在哪里?现在,这本不算特别厚实但是笔者呕心沥血之作的价值 在于,电脑虽然能替代人工计算过程,但是永远无法替代数据驱动的思想和思路,必须由我们人类赋予计算机以睿智的思路,计算机只是把我们解决问题的思路做成 软件封装起来而已。另外,侧重数据分析、挖掘思路的设计与仅围绕数据求解工具阐述事实相比,书籍不容易过时。
(4)本书具有一些独特的内容。譬如用博弈论解释了淘宝平台商家集群的现象,用弗洛伊德梦的解析理论去解释互联网生态等,并非笔者牵强附会,而是知识之间确实可以融会贯通。有的时候,我们以为发现了或者发明了一种新方法或新理论,其实有可能在其他领域早已可以找到影子。
(5) 对技术思路做了化繁为简的讲解。书中所讲解的商业案例很多都是根据数据驱动大项目改编而来,以期尽可能使案例精彩、详实;至于技术层面,部分来自当前先进 的人工智能技术和一些统计学理论。为了规避读者阅读的时候,生僻的技术理论所带来的不适应的体验,我们对技术思路做了化繁为简的讲解,对结论做了近似白话 的叙述。
(6) 注重举一反三能力的培养。德国教育学家斯普朗格曾说:“不是传授已有的东西,而是要把人的创造力量诱导出来,将生命感、价值感唤醒。唤醒,是一种教育手 段。父母和教师不要总是叮咛、检查、监督、审查他们。孩子一旦得到更多的信任和期待,内在动力就会被激发,会更聪明、能干、有悟性。” 斯普朗格的方法论不仅适合孩子的教育,亦对笔者有所启示。读完这本书,相信读者会有更多的灵感。灵感也许并不来自这本书,但是有可能是阅读过程中碰撞出来的。创造力是需要被哪怕一点点微弱的灵感唤醒的。
(7)内容详实,文字活泼,字里行间透射灵动鲜活的魅力。在本书编写过程中,在保证描述精准的前提下,我们摒弃那些刻板、索然无味的文字,让文字也有活力和张力。
这本书能够如期完成,笔者的夫人查玲凤女士功不可没,是她分担了家庭的里里外外才让笔者 有足够的时间和精力去编写这本书。还要重点感谢电子工业出版社张彦红老师(出版喜洋洋)长期的鼓励和支持,因为写作难度极大,曾经一度想放弃。另外,感谢 电子工业出版社各位文字校对老师及给出中肯意见的各位老师,辛苦了!
这本书适合独立B2C商城的高管、各种电商平台的店长和数据驱动相关从业者使用,也适合作为在校电子商务本科生和研究生的参考用书。
由于笔者经验和知识水平有限,书中若有疏漏或者纰漏的地方,还请读者朋友们不吝批评指正。
雪鹰传奇
上海市浦东新区陆家嘴
2014年2月