用户画像、用户标签
什么是用户画像
用户画像是指从用户的基础信息(社会属性)、用户行为(消费习惯,偏好特征)、业务信息等海量数据中,抽象出一个个标签,通过给用户贴上若干标签来还原用户全貌的过程。用户画像,即用户信息标签化。
例如,对 Marry 而言,其用户画像可简单描述为 80 后白领、居住地北京、喜欢兰蔻、常去星巴克、关注可穿戴设备,若某电商网站提前得知 Marry 的信息,就可以根据其偏好特征,为其推送兰蔻品牌商品、星巴克优惠券、可穿戴设备产品,促使 Marry 在该电商网站完成购买。
直接关系到企业的市场竞争力和客户满意度。通过准确的用户画像,企业能够更好地理解客户需求,制定个性化的营销策略,从而提升转化率和客户忠诚度。所以,做好用户画像分析能极大程度上使消费者决策这块更加完善。


用户画像难点
数据收集困难,用户的行为动态变化快,分析解读难
什么是用户标签?
用户标签是通过对用户的基础信息、用户行为、业务信息等数据,进行数据建模所产生的用户特征。其标签值具有高度概括、相互独立及可枚举、可穷尽的特点。例如,性别可枚举为男、女、unkonw。
标签的分类
不同企业的标签分类有所不同,目前行业中通常有 2 大类常用标签分类方式:按用途分类、按统计方式分类。

按用途分类
按用途分类,标签可以分为基础信息标签、用户行为标签、业务偏好标签、场景标签,如下图所示。通常,在面向产品/业务人员时,我们需要根据实际业务需要进行类别划分,以便适配产品/业务人员在通用场景和定制场景下对标签的使用需求。

1)基础信息标签
基础信息标签用于描述用户的基础属性,包括自然属性、社会属性、业务属性等,如年龄、职业和收入水平等。
● 年龄:人在一生中需要不同的产品和服务,如在婴幼儿时期吃婴儿食品,在成年时期吃各类食物。人们对衣服、家居和娱乐等的喜好也与年龄有关,因此年龄是用户画像中常用的标签。
● 职业和收入水平:职业影响一个人的消费模式,如工人的消费水平可能较低,通常会购买一些物美价廉的产品;金融人员的收入水平较高,其消费水平可能较高,通常会购买高端产品。不同职业的人群的收入水平不同,针对高收入水平的消费者,运营人员可向其推荐更优质的产品,提高产品的转化率。
2)用户行为标签
用户行为标签主要通过洞察用户在最近一段时间内的各类行为,如搜索、收藏、加购等,进一步提炼出用户的需求。用户搜索或加购某类产品的频率越高,其消费需求就表现得愈加强烈。常见的用户行为标签包括近 7 天上网时段、近30 天收藏品类、近 30 天消费笔数等。运营人员可通过组合圈选有多种行为。
3)业务偏好标签
业务偏好标签用于描述用户的偏好业务内容,根据业务划分不同的分类。通常,电商行业的业务偏好标签包括运动户外、数码家电、食品保健等,其他行业的业务偏好标签根据实际业务而定。
一般情况下,以上 3 类标签即可满足常用标签的使用需求,因为其描述了 Who(基础信息)、Do(用户信息)、What(业务偏好)的整个过程。
但随着标签的使用,业务人员发现,经常会有些类似的活动使用了类似的标签组合、类似的人群的数据包。于是,业务人员可以把这类标签组合沉淀下来,针对特定场景使用。
4)场景标签
场景标签在特定场景下使用,由业务使用经验积淀而来,如“6·18”会场、“双十一”补贴领取人群、“双十一”预付定金人群、“双十一”下单人群等。企业在标签建设初期可不设置此类标签。
按统计方式分类
按统计方式分类,标签可分为事实类标签、规则类标签和预测类标签,常面向研发人员。
1)事实类标签
事实类标签是用户画像最基础、最常见的标签,用于描述客观事实。例如,姓名、会员等级、终端类型、购买次数、购买金额等。
2)规则类标签
基于确定的规则而产生的标签。与事实类标签不同的是,规则类标签拥有更多的业务属性,其业务规则需要数据产品经理与业务人员共同制定。例如,活跃用户标签可被定义为“过去 30 天发生 a 行为 m 次”和“过去 30 天发生 b 行为 n 次”,进行综合评定。
用户活跃度标签:实际业务场景会涉及根据用户的活跃度,给用户贴上高活跃、中活跃、低活跃、流失等标签。在这个过程中,高活跃、中活跃、低活跃、流失对应的时间范围是如何划分的?
如划分用户流失周期,运用“拐点理论”,即经济学中的边际收益大幅减少的点,如下图表中拐点。如下图,当流失周期增加到 5 周时,用户回访率的缩减速度明显下降,所以这里的 5 周就是拐点。我们可以用 5 周作为定义用户流失的期限,即一个之前访问/登录过的用户,如果之后连续 5 周都没有访问/登录,就定义该用户流失。

在划分完流失周期之后,我们在初期可根据四分位数,将用户的活跃度划分为高、中、低3种,在后期根据数据情况更新规则。
四分位数也称四分位点,是指在统计学中把所有数值从小到大排列并分为 4 等分,处于 3 个分割点位置的数值。例如,近 1 个月访问 App 次数为 0~8,则 3/4 分位点为 6、1/4 分位点为 2。
高活跃用户:近1个月访问App次数在[6,8]区间的用户。
中活跃用户:近1个月访问App次数在(2,6)区间的用户。
低活跃用户:近1个月访问App次数在[0,2]区间的用户。
3. 预测类标签(机器学习挖掘类标签)
该类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的行为习惯判断该用户是男性还是女性、根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。
在项目工程实践中,一般统计类和规则类的标签即可以满足应用需求,在开发中占有较大比例。机器学习挖掘类标签多用于预测场景,如判断用户性别、用户购买商品偏好、用户流失意向等。一般地,机器学习标签开发周期较长,开发成本较高,因此其开发所占比例较小。
RMF用户画像分析模型
● RFM标签:根据美国数据库营销研究所 Arthur Hughes 的研究,用户数据库中有 3 个神奇的要素,这 3 个要素构成了数据分析最好的指标:最近一次消费时间、消费频率、消费金额。
最近一次消费时间(Recency):用户上一次购买的时间,一般上一次消费时间越近的用户是质量更佳的用户。
消费频率(Frequency):用户在限定时间周期内消费的次数。消费频率高的用户,也是满意度高的用户。根据这个指标,我们可以把用户分成几等分,相当于划分了一个忠诚度的阶梯。
消费金额(Monetary):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。产能最直接的衡量指标,也可以验证“二八定律”,企业 80% 的收入来自 20% 用户。
RFM 分析就是通过三个关键指标对客户进行观察和分类,判断每类细分用户的价值。针对不同的特征的客户进行相应的营销策略。也就是说这个模型提前将用户画像分类好,对于满足这个等级的客户,就设定一个统一的用户画像,方便管理。RFM 分析后,将客户划分为了不同分类,数据分析效果如下图所示:


创建分析主题对原始数据进行加工。实现思路如下图所示:
1)创建分析主题,选择 RFM 分析所需字段。
2)对数据进行加工,求得 3 个关键指标及其平均值。
3)通过和平均值比较,向量化三个指标。
4)根据特征向量客户分类。已经得到客户的特征向量值,根据以下表格可将客户划分分类:

我们采用“二八定律”的思路进行划分,定律提出者帕累托认为,在任何一组东西中,最重要的只占其中一小部分,约 20%,其余 80% 尽管是多数,却是次要的。给一个企业带来 80% 利润的是 20% 的用户。按照这个定律,如果能把这 20% 的用户找出来,为其提供更好的服务,就能促进企业的发展和业绩增长。
R:如在历史数据中,80%的用户最近一次访问<90日为“近”,80%的用户最近一次访问≥90日为“远”。
F:如在历史数据中,80%的用户订单量<10单为“低频”,80%的用户订单量≥10单为“高频”。
M:如在历史数据中,80%的用户交易金额<2000元为“低额”,80%的用户交易金额≥2000元为“高额”。
用户类型划分如下图所示:

标签的生命周期管理
标签是有时效性的,每天都有大量的标签生产上线,同时也会有很多标签长时间不使用变成废弃的僵尸标签。对于后者,为保持画像的简洁,需要及时回收下线;针对线上正在应用的标签,也需要很好的管理标签生命周期相关信息,例如使用数据的时间窗、数据是否更新、更新的方式及更新频次。
据是否需要更新,可以将标签简单划分为两大类: 静态标签和动态标签。
1)静态标签
这里静态的意思是自标签生成起,就不需要更新。静态标签对应的往往是变更概率很低的属性,例如用户社会性别,一个用户的社会性别一旦确定就不会变更,这种标签就可以认为是静态标签,不需要更新。
2)动态标签
与静态标签相反,有些标签是动态变化的,例如重要动作的频次、距今天数等标签,需要统计用户从登录或者激活起至今的天数或者次数,这种标签就是动态的,需要更新的,而且需要从登录或激活时间累加,按天更新;另外还有一类标签,主要集中在用户偏好标签,用户对产品功能模块或者商品内容的偏好变化很频繁,所以对应的标签是动态的,而且需要滚动更新近一年或半年的行为数据,更新频次为天。
这就是标签生命周期管理要确认的事情;标签是否需要按照什么方式以什么频次更新什么时间的数据。这也是标签管理重要的一环。
用户画像和大数据
而用户画像可以帮助大数据“走出”数据仓库,针对用户进行个性化推荐、精准营销、个性化服务等多样化服务,是大数据落地应用的一个重要方向。数据应用体系的层级划分如图2所示。

用户画像8大系统模块及解决方案
搭建一套用户画像方案整体来说需要考虑8个模块的建设,如图3所示。

- 用户画像基础:需要了解、明确用户画像是什么,包含哪些模块,数据仓库架构是什么样子,开发流程,表结构设计,ETL设计等。这些都是框架,大方向的规划,只有明确了方向后续才能做好项目的排期和人员投入预算。这对于评估每个开发阶段重要指标和关键产出非常重要。
- 数据指标体系:根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度的指标体系。
- 标签数据存储:标签相关数据可存储在Hive、MySQL、HBase、Elasticsearch等数据库中,不同存储方式适用于不同的应用场景。
- 标签数据开发:用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各业务系统之间的通路,提供接口服务等开发内容。
- 开发性能调优:标签加工、人群计算等脚本上线调度后,为了缩短调度时间、保障数据的稳定性等,需要对开发的脚本进行迭代重构、调优。
- 作业流程调度:标签加工、人群计算、同步数据到业务系统、数据监控预警等脚本开发完成后,需要调度工具把整套流程调度起来。
- 用户画像产品化:为了能让用户数据更好地服务于业务方,需要以产品化的形态应用在业务上。产品化的模块主要包括标签视图、用户标签查询、用户分群、透视分析等。
- 用户画像应用:画像的应用场景包括用户特征分析、短信、邮件、站内信、Push消息的精准推送、客服针对用户的不同话术、针对高价值用户的极速退货退款等VIP服务应用。
一款用户画像产品是什么样的
开发画像后的标签数据,如果只是“躺在”数据仓库中,并不能发挥更大的业务价值。只有将画像数据产品化后才能更方便业务方的使用。这里简要介绍用户画像产品化后,主要可能涵盖到的功能模块,以及这些功能模块的应用场景。
画像产品按常见的功能来看,主要包括标签视图与即时查询,用户分群,用户人群透视分析,对用户从事件、留存、漏斗、分布等多维度展开的深入交互式分析等模块。下面详细介绍画像的产品形态。
1. 标签视图与查询
标签视图与查询功能主要面向业务人员使用,如图4所示。

在标签视图版块中,层级化地展示了目前已经上线使用的全部用户标签。用户可以层级化地通过点击标签,查看每个标签的详细介绍。
在图4中,当点击“用户属性”这个一级类目,可进入到“自然性别”“购物性别”“用户价值”等二级类目,点击“自然性别”二级类目,可看到展开的“男性”“女性”三级标签,进一步点击三级标签“男性”或是“女性”,可以进入查看该标签的详细介绍,如图5所示。

在该标签详情页中,可以查看人口属性这一个类目下面的各个标签覆盖用户量情况。
每天通过对标签的覆盖用户量进行监控,可以作为预警使用。例如:某天某个标签的覆盖用户量与前一天相比出现了很大比例的波动,需要排查该标签当日ETL作业是否出现异常或是否因业务上的操作导致标签量级的波动。

在标签查询模块中,通过输入用户对应的userid或cookieid,可以查看该用户的属性信息、行为信息、风控属性等多维度的信息,从多方位了解一个用户的特征。
2. 用户人群功能
用户人群功能主要面向业务人员使用。产品经理、运营、客服等业务人员在应用标签时,可能不仅仅只查看某一个标签对应的人群情况,更多地可能需要组合多个标签来满足其在业务上对人群的定义。
例如:组合“近30日购买次数”大于3次和“高活跃”“女性”用户这三个标签进行定义目标人群,查看该类人群覆盖的用户量,以及该部分人群的各维度特征。下面介绍产品上的实现方式。
在“用户人群”版块下,点击“新建人群”或编辑之前已添加的分组(如图6),进入详情页可自定义涵盖某些标签的人群(如图7)。


在自定义编辑用户分群时,对于有统计值类型的标签,可以自定义筛选该标签的取值范围,如上图中“近30日购买次数”标签,业务人员可筛选该标签的数值。对于分类型标签,如上图中“活跃度”标签,业务人员选中该标签即可圈出包含该标签的用户。
“人群名称”和“人群描述”表单用于业务人员描述该人群在业务上的定义,方便后续继续查看、应用该人群。
用户画像的广泛应用场景与作用
- 产品设计与优化
用户画像在产品设计与优化中发挥着关键作用,主要体现在以下几个方面:
– 需求识别:通过用户画像,设计者能够更准确地识别目标用户群体的核心需求和痛点,从而在产品功能设计上做出有针对性的调整。
– 个性化定制:用户画像提供了用户偏好和行为习惯的详细信息,使得产品设计能够实现个性化定制,满足不同用户的特定需求。
– 用户体验优化:利用用户画像中的使用场景和心理特征,设计者可以优化用户界面和交互流程,进而提升用户体验。
- 市场细分与定位
用户画像在市场细分与定位中同样具有显著作用:
– 市场细分:根据用户画像中的人口统计信息、行为特征等,企业可以将市场划分为不同的细分市场,并为每个细分市场定制相应的产品和营销策略。
– 目标市场定位:用户画像揭示了不同用户群体的特征和需求,企业可以据此确定最具潜力的目标市场,并集中资源进行开发。
- 精准营销与推广
用户画像在精准营销与推广中扮演着重要角色:
– 个性化推荐:电商平台等利用用户画像进行商品推荐,显著提高用户满意度和购买转化率。
– 定制化广告:广告平台根据用户画像推送定制化广告,提高广告的相关性和吸引力。
– 营销策略优化:企业根据用户画像分析用户行为和反馈,不断优化营销策略,提高营销效果。
- 用户研究与洞察
用户画像在用户研究与洞察方面也具有广泛应用:
– 用户行为分析:通过分析用户画像中的行为数据,研究者可以洞察用户的行为模式和趋势。
– 用户需求预测:结合市场趋势分析,用户画像可以预测用户的未来需求和市场发展方向。
– 用户反馈整合:用户画像帮助整合和分析用户反馈,为产品迭代提供有力依据。
- 风险管理与决策支持
用户画像在风险管理与决策支持中也发挥着重要作用:
– 信用评估:金融机构利用用户画像评估客户的信用风险,优化信贷策略。
– 市场风险预测:通过用户画像分析市场变化,预测潜在的市场风险,为决策提供支持。
– 决策制定:用户画像提供的数据支持帮助管理层做出更加科学和合理的战略决策。
用户画像的评估与优化策略
- 核心评估指标
为了确保用户画像的准确性和实用性,需要对其进行有效的评估。
以下是一些核心评估指标:
– 准确性:评估用户画像是否真实反映了目标用户群体的特征,可以通过与实际用户数据的对比分析来实现。
– 覆盖度:衡量用户画像是否全面覆盖了目标用户群体的多样性,确保代表性。
– 一致性:评估不同用户画像之间的一致性,确保它们在某些关键特征上不会相互矛盾。
– 更新频率:由于用户行为和偏好会随时间变化,需要评估用户画像的更新频率是否满足市场和用户的变化需求。
– 应用效果:通过跟踪用户画像在实际应用中的效果来评估其有效性,如个性化推荐系统的点击率、转化率等。
- 优化策略
为了不断提升用户画像的质量和应用效果,可以采取以下优化策略:
– 数据源多样化:拓展数据收集渠道,整合更多来源和类型的数据,以提高用户画像的丰富度和准确性。
– 算法优化:利用先进的数据分析和机器学习算法,提高用户行为预测的准确度和用户画像的动态适应性。
– 用户反馈机制:建立用户反馈机制,收集用户对产品或服务的实际体验反馈,用于调整和优化用户画像。
– 跨部门协作:促进市场、产品、技术等不同部门之间的协作与共享,形成闭环优化机制。
– 持续监控与评估:建立持续的监控和评估机制,定期检查用户画像的应用效果,并根据市场变化和用户反馈进行调整。
– 技术工具升级:随着技术的发展,不断升级用于用户画像分析和建模的工具,提高自动化水平和处理大数据的能力。

浙公网安备 33010602011771号