摘要: 模型目的:预防核心客户流失,提升核心客户活跃率 背景:女装C店,客户群稳定,每周上新款。一年有数次大促,一次VIP回馈 建模思路:一般客户管理模块会参考RFM,这里同样参考RFM。M(成交金额)上,以年为周期,周期内所有有成交客户为横轴,成交金额为纵轴,按成交金额降序排列。整个成交金额呈长尾分布。并 阅读全文
posted @ 2016-02-23 12:56 惟求天道 阅读(527) 评论(0) 推荐(0) 编辑
摘要: 好久不曾写文,久到提笔忘言的程度。然而工作几年下来,总得有一些思考和总结。这些思考和总结并不是形式上的,思考的目的是通过对过去的提炼,加深自己对职业,对一些问题的认知。首先关于“性格决定命运”,这句话挺对的,不过并不全面。应该是性格+心态+思维方式决定命运,当然这么说有个前提,“爹不是李刚”。这里说... 阅读全文
posted @ 2015-12-19 21:14 惟求天道 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 在数据挖据方面,Bregman散度和马氏距离主要用于相似性相异性测度。我们需要根据各测度的优缺点和数据类型去选取合适的测度。当然终究是越简单越好,这两个测度相对用得较少。通常我们碰到两对象的时候,根据对象数据类型不同,如标称的,序数的,比率的选取简便易行的测度,如下图:或者,如闵可夫斯基距离:其中r... 阅读全文
posted @ 2015-11-23 13:33 惟求天道 阅读(2056) 评论(0) 推荐(0) 编辑
摘要: Python简洁优雅,库丰富而强大,特别是在数据分析领域,有着重要的地位。下面是我学习中总结的一些重要,容易忘记的知识点一、Python是如何进行内存管理的?先说明一点,Python每创建一个对象,这个对象都是一个三元组(标识,类型,值)。当我们调用一个对象时一般是按引用传递,有必要时才按值传递。(... 阅读全文
posted @ 2015-11-08 22:31 惟求天道 阅读(2579) 评论(0) 推荐(0) 编辑
摘要: 本文主要想说明三个问题:一是样本的数字特征,二是样本方差和样本均值的方差的区别,三是三大分布怎样构造抽样分布。(一)为了简便,假设有一个正态分布总体ξ~N(µ,σ2),设想我们从中随机抽取n个样本,ξ1,。。。ξn。此时就有样本均值和样本方差了。样本均值很好理解,不就是算术平均:而样本方差呢,按之前... 阅读全文
posted @ 2015-11-05 00:37 惟求天道 阅读(3292) 评论(0) 推荐(0) 编辑