推荐系统
一个例子, 预测电影的评分
这个案例中, 我们要预测其中所有打问号的地方,预测他们的值是多少
其中 r(i, j) 如果是真, 则表示已经被评论上, 如果假,则未评论。
i 表示电影序号, j 表示用户序号
y(i, j) 表示评分序号, 值的范围为 0~5
推荐系统的任务就是, 利用算法,给定了一个如此的数据集,预测其中问号的值。
1. 基于内容的推荐(Content-Based)
问题: 使用基于内容的推荐算法,预测问号的值。
条件:有两属性, n = 2,x1 表示 浪漫程度, x2 表示 动作程度, 值的范围为0-1.0
解法: 首先预测 Alice 对于 电影 Cute Puppies of love 的值。
n = 2 , 表示有两个属性, 假设 theat(j) 是一个如图标注的值,则 最后预测的值为 4.95。
问题阐述, 目的,学习得到 theat(j)
使用线性回归,得到theat(j) 的最小值。 theat(j) 是一个 (n+1, 1) 的矩阵。
对上述函数进行整理
梯度下降查找最优
2. 协同过滤算法(Collaborative Filtering)
如果用户给了评分规则,告诉了每个用户的喜好,但是数据集中没有特征值,此时,如何预测问号中的值?
|
通过特征值,预测每个用户对其
算法实现流程
3. 算法的向量化实现