常用数据分析模型
常用数据分析模型:
1. 对外用户分析:
1)RFM分析
2)ABC分析
3)波士顿矩阵图
4)转化分析
5)购物篮分析-关联规则
6)留存分析
7)用户画像分析
8)月复购分析
9)AARRR用户运营分析
10)用户流入流出分析
11)用户生命状态分析
12)用户粘性分析
2. 内部运营分析
1)需求分析方法-KANO模型
2)库存周转分析
3)杜邦分析
4)盈亏平衡分析
1 RFM模型
RFM模型用于对于用户进行分类,并判断每类细分用户的价值。
三个关键指标:
最近一次消费时间(R):客户距离最近的一次采购时间的间隔。
最近一段时间内消费频次(F):指客户在限定的期间内所购买的次数。
最近一段时间内消费金额(M):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。
需要将R、F和M设计出来,并进行向量化,来构造出一系列指标来对应不同的客户类型。
对于上述表格中的高和低,进行二分化,高用1来表示,低用0来表示。
客户特征 |
客户分类 |
重要价值客户(111) |
最近消费时间近、消费频次和消费金额都很高(VIP) |
重要发展客户(101) |
最近消费时间较近、消费金额高,但频次不高,忠诚度不高,很有潜力的用户,必须重点发展。 |
重要保持客户(011) |
最近消费时间交远,消费金额和频次都很高。 |
重要挽留客户(001) |
最近消费时间较远、消费频次不高,但消费金额高的用户,可能是将要流失或者已经要流失的用户,应当基于挽留措施。 |
一般价值客户(110) |
最近消费时间近,频率高但消费金额低,需要提高其客单价。 |
一般发展客户(100) |
最近消费时间较近、消费金额,频次都不高。 |
一般保持客户(010) |
最近消费时间较远、消费频次高,但金额不高。 |
一般挽留客户(000) |
都不高。 |
2 ABC分析
ABC 分类法全称应为 ABC 分类库存控制法。又称帕累托分析法或巴雷托分析法、柏拉图分析、主次因分析法 、ABC分析法、ABC 管理法,平常也称之为「80 对 20」规则。
A 类物品非常重要 |
数量占比少,价值占比大 |
B 类物品比较重要 |
没有A类物品那么重要,介于 A、C 之间 |
C 类物品一般重要 |
数量占比大但价值占比很小 |
分类的核心思想:少数项目贡献了大部分价值。以款式和销售量为例:A 款式数量占总体 10% ,却贡献了 80% 的销售额。
注:二八分析与 ABC 分类法大致相同,都是少数项目贡献了大部分价值。不同之处是ABC 分类法将对象分三类,而二八分析则为A、B两类,A类品牌商品占总体的一小部分,贡献了80%的销售额。
3 波士顿矩阵
波士顿矩阵(BCG Matrix),又称市场增长率-相对市场份额矩阵、波士顿咨询集团法、四象限分析法、产品系列结构管理法等。
波士顿矩阵将产品类型分为四种,如下图所示:
波士顿矩阵通过销售增长率(反映市场引力的指标)和市场占有率(反映企业实力的指标)来分析决定企业的产品结构。
通过设置警戒线,将区域分成四块象限,进而观察数据。同时设置钻取目录,挖掘更细粒度的数据。
波士顿矩阵在客户画像上的应用:
- 消费次数超过平均值,每次消费力度也超过平均水平的客户:判定为明星客户,这类客户需要重点关注,并给予最高的礼遇;
- 消费次数超过平均值,但每次消费力度未达到平均水平的客户:被判定为现金牛客户,这类客户通常消费频次比较频繁,能给企业带来较为稳定的现金流,这类客户是企业利润基石;
- 消费未达到平均值,但每次消费力度超过平均水平的客户:是问题客户,这类客户最有希望转化为明星客户,但是因为客户存在一定的潜在问题,导致消费频次不高,这类客户需要利用客服进行重点跟进和长期跟踪;
消费未达到平均值,消费力度也未达到平均水平的客户:属于瘦狗客户,这类客户通常占企业客户的大多数,只需要一般性维护,不需要投入重点维系。
4 转化分析
转化漏斗模型,是分析用户使用某项业务时,经过一系列步骤转化效果的方法。
转化分析的本质是为了促进企业的核心业务的流通,最大化每个营销漏斗的转化率。
在理想情况下,用户会沿着产品设计的路径到达最终目标事件,但实际情况是用户的行为路径是多种多样。通过埋点事件配置关键业务路径,可以分析多种业务场景下转化和流失的情况,不仅找出产品潜在问题的位置,还可以定位每个环节流失用户,进而定向营销促转化。
计算公式:转化率=下一阶段用户人数/上一阶段用户人数
例如付款转化率=付款人数/下单人数
5 购物篮分析-关联规则
通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,即「购物篮分析」。
这部分涉及三个重要的指标:支持度、置信度和提升度。
关联分析由以下指标进行衡量。
定义 |
概率描述 |
举例说明 |
|
支持度 |
支持度是指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。 支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。 |
物品集A对物品集B的支持度support(A==>B)=P(A n B) |
今天共有10笔订单,其中同时购买牛奶和面包的次数是6次,那么牛奶+面包组合的支持度就是6/10=60% |
置信度 |
置信度是指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率 |
物品集A对物品集B的置信度confidence(A==>B)=P(A|B) |
今天共有10笔订单,其中购买A的次数是8,同时购买A和B的次数是6,则其置信度是6/8=75% |
提升度 |
先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,是看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。 |
L= P(A n B) /[P(A)*P(B)] |
今天共有10笔订单,购买A的次数是8,购买B的次数是6,购买A+B的次数是6,那么提升度是0.6/(0.8*0.6)>1,因此A+B的组合方式是有效的。 |
支持度计算公式:同时购买A和B订单数/总购买订单数
置信度计算公式:同时购买A和B订单数/购买A的订单数
提升度计算公式:支持度/((购买A次数/总购买订单数)*(购买B次数/总购买订单数))
6 留存分析
留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中, 经过一段时间后仍然存在客户行为(如登录、消费)。
留存不仅是个可以反映客户粘性的指标,更多地反映产品对用户的吸引力。
计算公式:某一段时间内(时间段a)的新增用户在若干天后的另一段时间(时间段b)的留存数量 / (时间段a)的新增用户总量
示例计算用户从激活某产品开始,在当日、一周内、两周内、三周内进行登录使用操作用户数占总登录人数的比率。
当日留存率:当日激活并登录用户数/当日激活的用户数
一周留存率:初次激活日为维度,计算「激活_登录时间差」为 1-7 的登录用户数/激活日的激活用户数
两周留存率:初次激活日为维度,计算「激活_登录时间差」为8-14的登录用户数/激活日的激活用户数
.....
7 用户画像分析
用户画像就是与该用户相关联的数据的可视化的展现;一句话来总结就是:用户信息标签化。
通过对用户人口属性:用户的年龄、性别、所在的省份和城市、教育程度、婚姻情况、生育情况、工作所在的行业和职业等和行为特征:活跃度、忠诚度等指标进行分析,从而帮助企业对用户进行精准营销、辅助业务决策。
用户画像可以是一个综合的数据分析结果。
8 月复购率分析
月内复购率=一个月内购买两次及以上的人数/该月内总购买的人数
比如一个月内有100个用户购买商品,其中有20人购买了2次以上,那么月复购率就是20%。
同理可以改变统计周期,计算季度复购率、年复购率等。
复购率可以帮我们观察用户的忠诚度。
提升复购率,可以提高用户购买的频次。业务的持续增长除了拉新获客的持续输入,存量用户的复购尤为重要。
9 AARRR用户运营分析
AARRR 模型又叫海盗模型,是用户运营过程中常用的一种模型,解释了实现用户增长的 5 个指标:获客、激活、留存、收益、传播。从获客到传播推荐,整个 AARRR 模型形成了用户全生命周期的闭环模式,不断扩大用户规模,实现持续增长。
每一个产品具体情况不同,但总体上都包括这 5 个方面的发展过程。
对于传播阶段:
当产品有了一定规模的用户之后,就需要考虑激发用户间的自发传播。自传播的数据指标是K因子(推荐系数):
K = (平均每个用户向他的朋友们发出的邀请的数量)* (接收到邀请的人转化为新用户的转化率)
K值的高低,直接体现自传播结果水平,当K值大于1时,将激发自传播巨大的力量,K值越大,力量越强。而若K值小于1,那么传播水平会逐步减弱,直至消失。
10 用户流入流出分析
针对品牌来进行开展
流入原因分为「其他品牌流入、渠道流入、类别流入」
流出原因分为「品牌流出、渠道流出、类别流出」
流入人数:近 6 个月有交易,前推 6 个月无交易的用户。
流失人数:前推 6 个月有交易,近六个月无交易的用户。
以用户A为例,他在近六个月购买了诺基亚的电子产品,前推六个月没有购买诺基亚的电子产品。对于诺基亚的电子产品类别来说,这个用户是一个流入客户。但这个用户是从哪里流入的呢:
- 其他品牌流入:用户A若是前推 6 个月在百货别的品牌购买了电子产品,对于诺基亚电子产品类别来说,该客户属于其他品牌流入。
- 类别流入:用户A若是前推 6 个月只在百货购买了别的类别的产品,没有购买电子设备。那么他流入的原因是因为他需要电子类别的产品,所以属于类别流入。
- 渠道流入:用户A若是前推 6 个月没有在百货购买商品,说明他是百货的新客户,所以他属于渠道流入。
流出反之亦然。
11 用户生命状态分析
对已有客户的生命状态进行分类分析。这里用了两个维度「最近一次登录距今的时间」和「第一次登录距今的时间」。根据这两个维度,可以将客户简单的分为四个类别。
- 新用户:刚开始在较短的一段时期内登录/购买了产品的客户。
- 一次性用户:在较短一段时间内登录/购买产品后,近期不再继续购买的客户。
- 忠实用户:在较长一段时间内持续登录/购买产品,且在近期仍有购买行为的客户。
- 流失用户:在较长一段时间内持续登录/购买了产品,但近期不再有购买行为的客户。
可以了解企业当前的市场竞争力,并对不同类别的客户实施不同的营销动作。
实例:
激活时间小于等于 180 天,且最近一次登录在 60 天内:新用户;
激活时间小于等于 180 天,且最近一次登录距今大于 60 天:一次性用户;
激活时间大于 180 天,且最近一次登录距今大于 60 天:流失用户;
激活时间大于 180 天,且最近一次登录距今在 60 天内:忠实用户;
12 用户粘性分析
用户粘性是指用户对于品牌或产品的忠诚、信任与良性体验等结合起来形成的依赖程度和再消费期望程度,是了解产品健康度的重要指标。
例如可以为统计一周内用户使用产品的天数分布,使用了 2 天的有多少人,连续使用 7 天的有多少人;统计一周内登录两天以上的人数随时间的走势情况,一周登录两天以上的人数越多,说明产品健康度更好;
13 需求分析方法-KANO模型
KANO模型:是对用户需求分类和优先排序的有用工具,以分析用户需求对用户满意的影响为基础,体现了产品性能和用户满意之间的非线性关系。
四个象限对应了四种需求类型,它们的优先级排序为:必备型需求>期望型需求>兴奋型需求>无差异需求。
- 必备型需求(必须有):即常说的痛点。对于用户而言,这些需求是必须满足的,理所当然的。当不提供此需求,用户满意度会大幅降低。这类是核心需求,也是产品必做功能。
- 期望型需求(应该有):当提供此需求,用户满意度会提升;当不提供此需求,用户满意度会降低。通常作为竞品之间比较的重点。
- 兴奋型需求(可以有):惊喜型产品功能,超出用户预期,往往能带来较高的忠诚度。不提供也不会降低用户满意度。
无差异需求(可以没有):用户根本不在意的需求,对用户体验毫无影响。尽量规避做此类型功能。
14 库存周转分析
库存周转率是企业在一定时期销货成本与平均存货余额的比率,用于反映库存周转快慢程度。周转率越高表明存货周转速度越快,从成本到商品销售到资金回流的周期越短,销售情况越好。
库存周转天数是企业从取得存货开始,至消耗、销售为止所经历的天数。周转天数越少,说明存货变现速度越快,销售状况越良好。
通过计算公式实现:
计算内容 |
公式 |
平均存货余额 |
(期初存货金额+期末存货金额)/2 期初存货金额:上期账户结转至本期账户的余额,在数额上等于上期期末金额 期末存货金额=期初金额+本期增加发生额-本期减少发生额 |
销货成本 |
单件销货成本*销售件数 |
库存周转率 |
销货成本/平均存货余额 |
库存周转天数 |
360/库存周转率 |
15 杜邦分析
杜邦分析法利用几种主要的财务比率之间的关系来综合地分析企业的财务状况,用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效。
其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。
净资产收益率=销售净利润率*资产周转率*权益乘数
净资产收益率受三类因素影响:
指标 |
说明 |
销售净利润率=净利润/销售收入 |
表明企业的盈利能力 |
资产周转率=销售收入/总资产 |
表明企业的营运能力 |
权益乘数=总资产/净资产(权益)=1/(1-资产负债率) |
财务杠杆:用权益乘数衡量,表明企业的资本结构 |
16 盈亏平衡分析
盈亏平衡分析又称保本点分析或本量利分析法,是根据产品的业务量、成本、利润之间的相互制约关系的综合分析,用来预测利润,控制成本,判断经营状况的一种数学分析方法。
总成本=固定成本+变动成本】【利润=月销售额-总成本】
- 固定成本:在一定范围内不随销售额的增减而变动的成本,例如:房租、水电、人工费等。
- 变动成本:指随销售额的增减大致成正比例关系变化的成本,例如:销售提成,商品进货成本等。
盈亏平衡销售额=固定成本/每销售一块钱的毛利润
进货成本:定价(吊牌价)=销售额/销售折扣,进货成本=定价*定价比例;
平台扣点:在平台上的店铺(比如某宝),需要支付销售额的一定比例作为平台手续费;
员工提成:需要支付销售额一定的比例给员工作为提成,提高员工的积极性;
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
2020-04-01 Python+Spark2.0+hadoop学习笔记——实战之推荐引擎