帮助你很好的理解用户画像
用户画像
用户画像首先的是商业目的下的用户标签的集合,例如:猜用户是男是女,哪里人,工资多少,有没有谈恋爱,喜欢什么,准备剁手购物吗?探讨这些是没有意义的。而探讨是男是女如何影响消费决策,工资多少影响消费能力,有没有谈恋爱会否带来新的营销场景,剁手购物怎么精准推荐,这些才是用户画像背后的逻辑。
1、什么是用户画像
- 根据用户在互联网留下的种种数据和痕迹,主动或被动地收集,最后加工成一系列的标签。比如猜用户是男是女,哪里人,工资多少,有没有谈恋爱,喜欢什么,准备剁手购物吗?
- 我们常把用户标签和用户画像对等。但其实用户标签不等于用户画像,标签化只是用户画像最直观的解释。
- 用户画像的正式名称是User Profile,更多是运营和数据息息相关的平台级应用,本质是对任何一个用户都能用标签和数据描述。
2、用户画像的应用
- 精准营销:这是运营最熟悉的玩法,从粗放式到精细化,将用户群体切割成更细的粒度,辅以外呼、短信、推送、邮件、活动等手段,驱以关怀、挽回、激励等策略。
- 数据应用:用户画像是很多数据产品的基础,诸如耳熟能详的推荐系统、广告系统。例如:广告投放是基于一系列人口统计相关的标签,性别、年龄、学历、兴趣偏好、手机等等。
- 用户分析:一般在产品早期,PM们通过用户调研和访谈的形式了解用户。在产品用户量扩大后,调研的效用降低,这时候会辅以用户画像配合研究。例如:新增的用户的特征,核心用户的属性是否变化等等。
- 数据分析:用户画像可以理解为业务层面的数据仓库,各类标签是多维分析的天然要素。数据查询平台会和这些数据打通。
对大部分产品,用户画像用不到推荐系统,个性化推荐也提高不了几个利润,毕竟它需要大量的用户和数据作支撑。所以这些产品,更适合以用户画像为基础去驱动业务。提了那么多好处,但是据了解,不少公司,花了一大笔钱招了不少人建设用户画像系统,结果用不起来。或者做了一份用户画像的报告,性别、地理位置、用户消费金额等,看上去挺高大上的,看完也就看完了。归根结底,难以用好。很多用户画像初衷是好的,但是沦为了形式主义。
关于使用用户画像提出的疑问和思考:
用户有那么多维度,怎么合理地选择标签?我想定义用户的层级,VIP用户应该累积消费金额超过多少?是在什么时间窗口内?为什么选择这几个标准?后续应该怎么维护和监控?业务发生变化了这个标签要不要改?设立好标签,怎么验证用户画像的有效性?我怎么知道这套系统成功了呢?效果不佳怎么办?它有没有更多的应用场景?
3、怎样深入理解用户画像
用户画像的标签一般通过两种形式获得,基于已有数据或者一定规则加工,流失标签和距今天数皆是。另外一种是基于已有的数据计算概率模型,会用到机器学习和数据挖掘。
推断用户真实性别
中国人的性别和名字是强相关,建国建军,翠花翠兰,很容易判断。算法中常用贝叶斯,通过已有的姓名性别库预测新加入的用户性别。
特殊情况下,不少姓名是中性,男女不辩。像晓晶,可男可女。更特殊的情况,看上去是男性的名字,也有可能是女性,我的初中老师就叫建军,然而是个和蔼可亲的小姐姐。所谓概率,它更习惯告诉你,通过模型推断,建军有95%的可能是男性姓名,表示为0.95;晓晶有55%的可能是男性,表示为0.55。
我们想要挽回流失用户,选择80%以上概率的人群,还是60%呢?这是要考虑业务,挽回流失用户是手段而不是目的,我们实际目的是通过挽回流失用户提高利润,那么阈值的选择迎刃而解。计算不同阈值下,挽回用户的收入和成本,选择最优解。
推而广之,推荐系统也好,广告系统也罢,它们有更复杂的维度、标签、特征,本质也是找出用户最近想不想买车,用户最近想不想旅游等。把最合适的信息在最恰当时机推给用户,获取最大的利益。
4、如何建立正确的用户画像
用户画像首先是基于业务模型的,不同的业务涉及到的标签、维度都是不同的。如果业务部门连业务模型都没有想好,数据部门只能巧妇难为无米之炊。数据部门也别关门造车,这和做产品一样,连用户需求都没有理解透彻,匆匆忙忙上线一个APP,结果无人问津。
理解消费者的决策,考虑业务场景,考虑业务形态,考虑业务部门的需求…这些概念说得很虚,但是一个好的用户画像离不开它们。
5、用户画像的架构
不同业务的用户画像标签体系是不一致的,这需要数据和运营目的性的提炼。
用户画像一般按业务属性划分多个类别模块。除了常见的人口统计,社会属性外。还有用户消费画像,用户行为画像,用户兴趣画像等。具体的画像得看产品形态,像金融领域,还会有风险画像,包括征信、违约、洗钱、还款能力、保险黑名单等。电商领域会有商品的类目偏好、品类偏好、品牌偏好,不一而足。
上图将用户的上网记录划分成4部分,人口属性、社会属性、消费、用户行为,在大的类别下面可以继续划分。但最终的标签的确定还是需要根据实际的业务场景来确定,不能做到通用性。
上图列举了标签加工和计算的过程,很好理解。最上层是原始数据,我们首先根据原始数据初步提炼出一些基本标签(也就是事实标签),最下层的预测标签,是针对业务的落地,运营人员通过多个标签的组合形成一个用户群组,方便执行。