吴恩达机器学习笔记59-向量化：低秩矩阵分解与均值归一化（Vectorization: Low Rank Matrix Factorization & Mean Normalization）

一、向量化：低秩矩阵分解　　

　　之前我们介绍了协同过滤算法，本节介绍该算法的向量化实现，以及说说有关该算法可以做的其他事情。

　　举例：
1.当给出一件产品时，你能否找到与之相关的其它产品。
2.一位用户最近看上一件产品，有没有其它相关的产品，你可以推荐给他。

我们将要做的是：实现一种选择的方法，写出协同过滤算法的预测情况。

　　我们有关于五部电影的数据集，我将要做的是，将这些用户的电影评分，进行分组并存
到一个矩阵中。
　　我们有五部电影，以及四位用户，那么这个矩阵 𝑌 就是一个5 行4 列的矩阵，它将
这些电影的用户评分数据都存在矩阵里：

我们记：

推出评分：

上述就是协同矩阵的向量化。

　　那么我们应该怎样来找出相关商品呢？

首先对于每一个产品i，我们找出其特征向量

找出使两个商品特征比较相同的产品，即可以找出使得最小的五个商品，则这5个商品就是和i最相似的5个商品，既可以作为相关产品推荐。

二：均值归一化

　　假设有下面一组数据：

即有一个用户Eve没有对任何电影进行评价，这时候如果我们使用之前的方法测Eve对每部电影的评分，则最小化图上的公式，因为对于任意i，Eve都没有评分过，因此①式r(i, j)=1条件不满足，因此①对于最小化Eve的数据没有作用，②也没有作用，因此对于最小化Eve数据有作用的便是③式，即，因此二者都为0，因此于是对于Eve的预测评分都为0。