推荐系统“特征”的理解

推荐系统“特征”的理解

正排矩阵

每行表示一个用户,每列表示一个属性

用户ID 年龄 性别 视频1偏好度 视频2偏好度 视频3偏好度 ...
User1 25 0.8 0.1 0.6 ...
User2 32 0.3 0.7 0.2 ...
User3 40 0.4 0.5 0.9 ...

u侧特征

对于一个u侧特征,每个用户有其独有的值

正排矩阵的一列可以抽成一个u侧特征

特征示例

  • 用户年龄:28岁
  • 用户性别:女
  • 历史观看记录:主要观看科幻电影和纪录片
  • 最近观看的视频类型:科幻电影

group侧特征

一个group就是一个视频

g侧特征,对于不同的视频值不一样,对于所有用户都是一样的

特征示例

  • 视频id,作者id
  • 播放次数
  • 点赞数

cross特征

把用户(u侧)和视频(g侧)混合计算得到的一种特征

推荐流程(大致)

  1. 特征整合
    • 将用户侧特征和群组侧特征整合在一起,比如g侧放到正排矩阵作为一个个额外列,一列数据一样。g侧虽然对每个用户一样,但和u侧融合后有attention价值,反之u对g的影响也是(我猜的)。
  2. 模型输入
    • 将这个整合后的特征向量输入推荐模型。这个模型可能是一个基于机器学习的算法,如协同过滤、内容基推荐或深度学习模型。
  3. 推荐计算
    • 推荐模型分析这个用户的特征向量,与数据库中的视频特征进行比对,输出6条推荐视频。
    • 实际计算根据召回、粗排、精排会用不同的模型和策略
posted @ 2023-12-08 17:08  Kinghao0319  阅读(32)  评论(0编辑  收藏  举报