用户画像知识
用户画像相关知识点
1、用户画像是什么?
用户画像(User Profile),即用户信息标签化。
用户画像有很多的的标签组成,每个标签都规定了观察、认识、描述用户的角度。标签根据企业业务的发展情况,或多或少,对外而言都是一个整体,这个整体称之为用户画像。
2、为什么需要用户画像?
用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理。
大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。
用户画像的本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户。
3、用户画像怎么设计?
一个标签通常是人为规定的高度精炼的特征标识。
3、1 数据源分析
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
3.1.1 静态信息数据
用户相对稳定的信息。
3.1.2 动态信息数据
用户不断变化的行为信息。
在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。
3.2 目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。
3.3 数据建模方法
如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。
3.3.1 什么用户
关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。
3.3.2 什么时间
时间包括两个重要信息,时间戳+时间长度。
时间戳,为了标识用户行为的时间点。
时间长度,为了标识用户在某一页面的停留时间。
3.3.3 什么地点
用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。
3.3.4 什么内容
每个url网址(页面/屏幕)中的内容。
对于每个互联网接触点,其中网址决定了权重;内容决定了标签。
3.3.5 什么事
用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。
不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。
用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。
用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:
标签权重=衰减因子×行为权重×网址子权重
如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。
标签:红酒,长城
时间:因为是昨天的行为,假设衰减因子为:r=0.95
行为类型:浏览行为记为权重1
地点:品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7)
假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。
则用户偏好标签是:红酒,权重是0.95*0.7 * 1=0.665,即,用户A:红酒 0.665、长城 0.665。
4、用户画像怎么开发?
5、用户画像工作坚持的原则(金融企业)
金融企业是最早开始用户画像的行业。
事实上,用户画像涉及数据的纬度需要业务场景结合,既要简单干练又要和业务强相关,既要筛选便捷又要方便进一步操作。用户画像需要坚持三个原则,分别是人口属性和信用信息为主,强相关信息为主,定性数据为主。
5.1 信用信息和人口属性为主
描述一个用户的信息很多,信用信息是用户画像中重要的信息,信用信息是描述一个人在社会中的消费能力信息。
定位完目标客户之后,金融企业需要触达客户,人口属性信息就是起到触达客户的作用,人口属性信息包含姓名、性别,电话号码,邮件地址,家庭住址等信息。这些信息可以帮助金融企业联系客户,将产品和服务推销给客户。
5.2 采用强相关信息,忽略弱相关信息
强相关信息就是同场景需求直接相关的信息,其可以是因果信息,也可以是相关程度很高的信息。
5.3 将定量的信息归类为定性的信息
用户画像的目的是为产品筛选出目标客户,定量的信息不利于对客户进行筛选,需要将定量信息转化为定性信息,通过信息类别来筛选人群。
例如可以将年龄段对客户进行划分,18岁-25岁定义为年轻人,25岁-35岁定义为中青年,36-45定义为中年人等。可以参考个人收入信息,将人群定义为高收入人群,中等收入人群,低收入人群。
5.4 用户画像的方法介绍,不要太复杂
金融企业需要结合业务需求进行用户画像,从实用角度出发,我们可以将用户画像信息分成五类信息。分别是人口属性,信用属性,消费特征,兴趣爱好,社交属性。
5.4.1 人口属性
5.4.2 信用属性
5.4.3 消费特征
5.4.4 兴趣爱好
5.5 金融企业用户画像的基本步骤
5.5.1 画像相关数据的整理和集中
5.5.2 找到同业务场景强相关数据
5.5.3 对数据进行分类和标签化(定量to定性)
5.5.4 依据业务需求引入外部数据
5.5.5 按照业务需求进行筛选客户(DMP(大数据管理平台)的作用)