04 推荐系统可用特征
下图是特征工程在推荐系统中的位置:
推荐系统常用的特征:
1.用户行为数据:显性反馈与隐性反馈(容易获得)。
2.用户关系数据:强关系(好友)和弱关系(有点关系)。
3.属性与特征数据:一般先用muti-hot编码,再进行embedding,目前业界大多先构建属性与主体之间的知识图谱,再进行embedding。
4.内容类数据:提取关键特征。
5.上下文数据。
课后思考如果你是一名音乐 APP 的用户,你觉得在选歌的时候,有哪些信息是影响你做决定的关键信息?那如果再站在音乐 APP 工程师的角度,你觉得有哪些关键信息是可以被用来提取特征的,哪些是很难被工程化的?
1.1)喜欢类型
2)喜欢歌手
3)大家喜欢的音乐
4)朋友推荐的音乐
2.1)用户点击、收藏、评论行为数据
2)用户的好友信息
3)歌曲的类别与用户的风格数据
4)当下的流行信息
5)用户的上下文信息,地点、时间