摘要: 主成分分析(PCA)是最常见的降维算法。 在PCA 中,我们要做的是找到一个方向向量(Vector direction),当我们把所有的数据都投射到该向量上时,我们希望投射平均均方误差能尽可能地小。方向向量是一个经过原点的向量,而投射误差是从特征向量向该方向向量作垂线的长度。 下面给出主成分分析问题 阅读全文
posted @ 2019-03-12 18:55 chalee3 阅读(471) 评论(0) 推荐(0) 编辑
摘要: 目标一:数据压缩 除了聚类,还有第二种类型的无监督学习问题称为降维。有几个不同的的原因使你可能想要做降维。一是数据压缩,数据压缩不仅允许我们压缩数据,因而使用较少的计算机内存或磁盘空间,而且它也让我们加快我们的学习算法。 我们收集的数据集,有许多,许多特征,我绘制两个在这里。 假设我们未知两个的特征 阅读全文
posted @ 2019-03-12 06:19 chalee3 阅读(700) 评论(0) 推荐(0) 编辑