摘要: 基于协同过滤(collaborative filtering)的推荐引擎,是通过将用户和其他用户的数据进行对比来实现推荐 不是利用属性来描述物品从而计算它们之间的相似度,而是利用用户对它们的意见来计算相似度,这就是协同过滤中所使用的方法,它并不关心物品的描述属性,而是严格地按照许多用户的观点来计算相 阅读全文
posted @ 2020-03-14 22:03 moon~light 阅读(255) 评论(0) 推荐(0) 编辑
摘要: SVD(Singular Value Decomposition,奇异值分解)是一种强大的降维工具 很多情况下,数据的一小段携带了大部分信息,其他要么是噪声,要么就是毫不相关的信息,SVD 是矩阵分解的一种,可以把 SVD 看成是从噪声数据中抽取相关特征 优点:简化数据,去除噪声,提高算法的结果 缺 阅读全文
posted @ 2020-03-14 20:56 moon~light 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 降维 (dimensionality reduction)就是减少数据特征的维度 作用 使得数据集更易使用 降低很多算法的计算开销 去除噪声 使得结果易懂 PCA(主成分分析 Principal Component Analysis) PCA 将数据从原来的坐标系转换到了新的坐标系 第一个新坐标轴选 阅读全文
posted @ 2020-03-14 18:40 moon~light 阅读(385) 评论(0) 推荐(0) 编辑
摘要: FP growth(Frequent Pattern Growth)算法用于发现频繁项集 作用:比 Apriori 更高效的发现频繁项集 特点:快于 Apriori、实现比较困难 Apriori 每次增加频繁项集的大小,都会重新扫描整个数据集 当数据集很大时,这会显著降低频繁项集发现的速度 FP g 阅读全文
posted @ 2020-03-14 15:34 moon~light 阅读(391) 评论(0) 推荐(0) 编辑