足迹

能看不尽景,始是不凡人

 

推荐系统实战(1)

“信息过载”与推荐系统

茫茫的互联网中有越来越多的海量内容,而且这些内容的增长速度已经超越了人类大脑容量的处理速度,我们把这个问题叫做“信息过载”。

我们需要相应的技术手段来帮助我们处理“信息过载”问题。解决或者缓解“信息过载”问题的核心是需要一个漏斗来减少最终呈现给用户的信息数量(即 N -> 1问题),手段主要是下面三种:
融合
对相似的信息进行聚类融合,最终只呈现融合后的信息
摘要
对信息进行摘要,使得用户通过最少的内容来获取核心信息
筛选
对信息进行过滤,只呈现对用户有用的信息。

 

Alt text

Alt text

推荐系统主要就是通过筛选的方法来解决“信息过载”问题的。那么现在问题来了, 什么是“对用户有用的信息“呢?我们可以先来看下信息的长尾曲线:

Alt text
“对用户有用的信息”可以分为两类:

  1. Tall Head

  这一部分是大家都在看的热点内容,是互联网用户用手投票出来的内容(通过点击,点赞,评论, 推荐,转发,收藏等用户行为),用户需要这些信息来保持与社会的同步。我们叫它“基于热度的推荐”

  2. Long Tail

  这一部分体现的是用户自身独特的兴趣和趣味,它很小众但却是技术最能打动用户的地方。我们叫它“个性化推荐”

为什么要解决“信息过载”问题

为什么互联网公司热衷于解决“信息过载”问题呢?因为解决了它,会给商业带来至少两点好处:

  1.提高用户指标: 展示对用户有用的信息会带动用户的互动(提高点击率,转化率…)和粘性(提高用户逗留时长,DAU…),用户指标的提高与商业指标的提升呈明显的正比关系(对电商平台而言直接对应GMV,客单价,客户流失率等; 对内容平台直接对应可能产生的广告收益…)。

  2.提高用户模型价值:个性化推荐的副产品是用户画像,这些用户画像是用户特征的多维度刻画,本身就是一种高价值的数据产品,可用于需要定向化投放的各种产品(如广告)。DMP(Data Management Platform)公司就是卖这个的。

posted on 2016-12-21 21:42  姚伟峰  阅读(865)  评论(0编辑  收藏  举报

导航